Lista de lecturas recomendadas por Ilya Sutskever sobre machine learning/IA
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
- Desde la página 434 en adelante: Complejidad de Komogrov
- CS231n Convolutional Neural Networks for Visual Recognition
Colección de enlaces: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3 comentarios
Parece que hay un problema con el rastreo del bot de Neo.
Parece que Reddit lo bloquea. Lo puse manualmente ;)
Opiniones de Hacker News
Resumen de comentarios de Hacker News
El titular no refleja el verdadero alcance de esta tarea. Si haces clic para ver qué son estos materiales:
Hace algún tiempo también copié la lista en enlace para que fuera más fácil usar wget (por ejemplo, bajar todos los PDF de arXiv)
wget.Ten en cuenta que no hay confirmación de que esta sea la lista real.
How long does it take to learn the prerequisites to learn these if you don't already have a CS background?
Lo que la gente olvida es que, sin una meta adecuada y tangible, no importa cuántos artículos fundamentales o interesantes leas, al final no recordarás nada.
Hay algunas discusiones anteriores, que se remontan a octubre de 2022. Me pregunto qué tan desactualizada está la lista ahora.
This is just someone’s bookmarks folder. Where’s the proof these were recommended by Ilya?
El argumento de que esto representa el 90% de lo que importa en ML suena un poco atrevido.
Aquí no hay nada sobre LLMs, cuando el aprendizaje en contexto, retrieval augmentation, uso de herramientas y multimodalidad son justamente las áreas que más están avanzando.
Leer 30 estudios no significa "haber aprendido y entendido". Especialmente si empiezas desde cero.