- "Overview of SHARD: A System for Highly Available Replicated Data" 1988
- Fue el primer artículo en presentar el sharding de bases de datos y ha sido citado por numerosos artículos, pero "no existe"
- "Integral Neural Networks"
- "Blue Is the New Black (Market): Privacy Leaks and Re-Victimization from Police-Auctioned Cellphones"
- "Latency Lags Bandwidth"
- "Liquid solution centrifugation for safe, scalable, and efficient isotope separation"
- "Co-cultivation enhanced microbial protein production based on autotrophic nitrogen-fixing hydrogen-oxidizing bacteria"
- "Enso: A Streaming Interface for NIC-Application Communication"
- "Search-Based Regular Expression Inference on a GPU"
- "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm"
- "FP2: Fully in-Place Functional Programming"
- "Enabling tabular deep learning when d ≫ n with an auxiliary knowledge graph"
- "A Holistic Approach to Undesired Content Detection in the Real World"
3 comentarios
Integral Neural Networks es realmente muy impresionante.
Parece que la idea clave es el concepto de discretizar la distribución de pesos; suena a que, como en la teoría de muestreo, se puede discretizar una distribución de pesos expresada como una función continua para optimizar la cantidad de cómputo.
Si ves los LLM recientes, también hacen modelos que requieren menos cómputo con un rendimiento similar al cuantizar el modelo, así que parece una metodología parecida.
El primer punto es un poco absurdo, pero está divertido
Where is the original "Overview of SHARD" paper?
Viendo los comentarios en ese enlace, parece que el propio autor respondió recientemente.
Como era un documento para uso interno de una empresa/instituto de investigación, al parecer no había una forma de acceder a él públicamente.
"I'm the Ronni Rosenberg. This was an internal CCA paper (not from academia or a published journal), from 35 years ago! I don't have a copy and I have no idea how to get it. Sorry about that. It does seem to be the earliest reference to data "sharding." (The other early reference mentioned in Wikipedia is from much later, 1997.)
Fortunately, you need not go back 35 years to read about sharding; it's easy to get current info. Cheers."
En realidad, este tipo de casos ocurre con bastante frecuencia, y la razón por la que aun así se cita algo cuyo contenido original no puede verificarse directamente es para dejar claro el origen de un concepto o de una línea de investigación específicos que se mencionan en el paper. Desde la perspectiva de otros investigadores, es necesario confirmar si el sharding del que habla ese estudio es el mismo sharding que entienden los demás, si es un concepto distinto propuesto por otra persona pero con el mismo nombre, o incluso si en realidad es un concepto inexistente y alguien simplemente usó el nombre sharding para hacerlo pasar como válido.
Incluso en áreas como el deep learning, a veces hay modelos de red con el mismo nombre que en realidad son resultados de investigación diferentes.