- La IA generativa es la tecnología que evoluciona más rápido, y tanto subestimarla como sobreestimarla es peligroso
- Seguir de forma constante fuentes con autoridad y expertos confiables es indispensable
- Se recomienda una canalización de información equilibrada como Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
- Los anuncios oficiales de laboratorios de IA, blogs de ingeniería y papers son esenciales para entender el progreso real de la tecnología y sus límites
- Con canales diversos como Twitter/X, curación de noticias y listas de expertos, es posible acceder tanto a las tendencias más recientes como a análisis profundos
Introducción: malentendidos sobre la IA y contaminación informativa
- La IA generativa es la tecnología que avanza más rápido que el autor ha visto en su vida
- Pero también están muy extendidos los malentendidos sobre la IA, y el entorno informativo en sí es extremadamente caótico
- Ya existen casos reales en los que empresas, gobiernos o personas que no entienden suficientemente esta tecnología la usan mal o provocan daños graves
- Existen malentendidos en ambos extremos: subestimarla (tratarla como “una moda pasajera”) o sobreestimarla (“ya no se necesitarán programadores”)
- La raíz de estas confusiones es la falta de una comprensión correcta de la tecnología
Enfoque para adquirir información sobre IA
- Entender correctamente la información relacionada con IA no es tan fácil como parece
- Vivimos en un entorno donde estamos expuestos de forma cotidiana a información distorsionada, exagerada o reprimida
- Si no se filtra la información de forma intencional y sistemática, existe alto riesgo de quedar expuesto a errores, exageraciones y distorsiones
- El autor ha construido una canalización de información equilibrada que le ha sido útil, y la recomienda como un buen punto de partida para principiantes
Principios generales para informarse
- Es importante consultar información lo más cercana posible a la fuente original
- Hay que revisar como fuentes primarias los anuncios oficiales de los laboratorios de IA y las opiniones de figuras clave
- Hace falta una actitud de no confiar ciegamente en coberturas de segunda o tercera mano
- También hay que buscar activamente y apoyarse en los comentarios de expertos confiables
Puntos de partida recomendados
-
Simon Willison’s Blog
-
Andrej Karpathy
- Twitter/X | YouTube
- Miembro fundador de OpenAI y exdirector de AI en Tesla
- Es uno de los mejores canales para aprender de forma sencilla la estructura interna y los principios de los modelos de IA, además de observar su impacto cultural y los cambios sociales que provoca
- Ejemplos: Deep Dive into LLMs like ChatGPT, How I Use LLMs
Every’s Chain of Thought
Cómo monitorear materiales oficiales de laboratorios de IA
- Revisar periódicamente blogs oficiales, noticias, model cards, guías de ingeniería y papers de OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) y otros
- Laboratorios pequeños: también vale la pena seguir Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire
Expertos en IA e ingenieros prácticos a seguir
- La información de expertos que crean herramientas open source y tienen experiencia práctica en ingeniería de IA muchas veces resulta más útil en la práctica que las guías oficiales
Figuras y blogs recomendados
Uso de noticias/medios y comunidades de IA
-
Twitter/X
- Lista de Twitter/X
- Centro de las discusiones e información en tiempo real sobre IA, útil para detectar novedades y debates
- Se puede consumir el feed de Twitter como si se leyera el periódico durante 15 a 20 minutos, y seguir más personas o fuentes cuando haga falta
-
Shawn Wang(swyx) / smol.ai
-
Dwarkesh Patel
Comunidades para discusión profunda y materiales sobre IA
Formas prácticas de informarse
- No hace falta seguir perfectamente todas las fuentes; una forma práctica es leer el feed de Twitter como si fuera el periódico
- Si se encuentra un texto interesante, también se recomienda seguir a su autor y revisar sus otros trabajos, expandiendo así la exploración
- Es una forma de explorar información parecida a como antes se descubría música
- Si se aborda como una exploración intelectual divertida, puede convertirse en placer y no en obligación
Conclusión y lista recomendada
- A través de la lista de Twitter/X incluida, es posible seguir de una sola vez a los expertos y practicantes mencionados arriba
- Próximamente también se añadirá una lista en formato RSS
Ir directamente a la lista de Twitter
5 comentarios
Comentarios de Hacker News
Creo que si entiendes de forma básica cómo funcionan los LLM, no hace falta seguir todo el flujo constante de contenido de PR, blogueros, líderes de la industria y pensadores de internet
De hecho, si sigues esas entrevistas o textos, corres el riesgo de terminar persiguiendo modas raras que en realidad no ayudan
En la práctica, las diferencias entre modelos solo han sido cuestión de unos cuantos años, pero no de diferencias esenciales grandes; actualmente la mayoría de los cambios ocurren en herramientas o trabajo de integración
Hay que recordar siempre que los LLM al final son "modelos de texto" y se generan sin conocimiento subyacente; así puedes distinguir dónde son útiles y dónde no son adecuados
Personalmente tampoco conecto mucho con la afirmación de que "la IA ha sido la tecnología que más rápido avanzó en toda mi vida"
Yo viví la época en que SVM estaba de moda, cuando las "redes neuronales eran un chiste", y luego los más de 10 años en los que deep learning y varios frameworks de DL explotaron en cantidad
En ese tiempo también hubo avances realmente drásticos en una década
En la web pasó algo similar: JS era solo para complementar la UX y luego las single-page apps se volvieron el estándar
El punto clave es que, a menos que vayas a entrar en una "lista de influencers clave", una estrategia mucho mejor es simplemente esperar con calma hasta que llegue el momento importante para ti
Yo también ignoré durante 10 años todas las tendencias de desarrollo web desde la era de backbone.js, y cuando de verdad necesité React, estudié unos cuantos días y pude usarlo de inmediato
Hace 5 años todo el mundo quería aprender a implementar LSTM, pero ahora ya quedó anticuado por culpa de los transformers
Lo que he sentido durante toda mi carrera es que "moverse rápido" significa "no está maduro"
De hecho, aprender modelos estadísticos más antiguos (como GLM) y cómo seguir usándolos de forma práctica da soluciones mucho más productivas en el trabajo real que andar persiguiendo el "prompt hack" de moda
La primera son herramientas nuevas que son un poco distintas de las existentes o tienen un rendimiento un poco mejor (si traen una función que no existía, puede valer la pena, pero la mayoría pronto queda obsoleta)
Nombres como Kimi-K2 o GPT 4.1 podrían no ser mencionados por nadie dentro de unos meses
La segunda es cuando de verdad se agrega una capacidad nueva al modelo
Por ejemplo, RL (reinforcement learning), chain of thought, agentes de código que realmente funcionan, modelos multimodales de nivel top y conexiones inteligentes con herramientas
Basta con poner atención cuando aparezcan esos grandes saltos
En la práctica, con solo revisar publicaciones de HN con más de 500 puntos ya vas entendiendo naturalmente el flujo actual
Creo que la mejor forma de aprender las capacidades reales de los LLM no es con blogs o videos, sino creando cosas tú mismo y enfrentándote directamente a los problemas
La investigación, por naturaleza, avanza 99% de forma incremental (y eso está bien; no hay que frustrarse por ello)
La mayoría de los papers son más largos de lo necesario y, si los lees bien, con solo intuición matemática puedes predecir bastante (si entiendes la idea, más o menos anticipas el resultado)
Es fácil sentir que el campo cambia rápido, pero en realidad no va tan rápido como parece
Yo mismo me tomé un año por asuntos personales y, al volver, me di cuenta de que no había cambiado tanto
Tener esta perspectiva te libera de la presión de "mantenerte al día"
Si ahora te cuesta, eso solo significa que todavía te falta un poco de especialización, no que te hayas quedado atrás
Igual que cualquiera debe aprender a correr para poder seguir aunque sea un paso detrás, esa prisa no es más que una preocupación dentro de mi cabeza
El algoritmo central real (la forma de predecir el siguiente token) no le dice mucho a la mayoría de quienes no son del área
A nadie le importan detalles como dot product o embedding. Aunque se expliquen, cuesta que se queden y no ayudan demasiado
No hace falta seguir sí o sí las "últimas tendencias"; creo que conviene mantener un interés relajado e ir probando selectivamente solo las funciones o técnicas que de verdad mejoren mi eficiencia, acumulando solo lo que sí sirve (no confío mucho en cosas como "alguien recomendó X en X"). De hecho, pude aprender mucho escuchando a investigadores con una visión crítica del hype de la IA [https://x.com/burkov]. Ahora mismo hay demasiada exageración, cambio e incertidumbre. Si aparece una innovación real, seguro se va a escuchar en HN (o en la comunidad principal)
Siento que el texto no explica bien el "por qué", así que el "cómo" de la lista no resulta convincente. Mi tiempo valioso puede usarse perfectamente en otra cosa
Estoy suscrito al newsletter "Pragmatic Engineer" de Gergeley Orosz (últimamente con muchos temas de IA) y también reviso el Substack de Gary Marcus (con una mirada más escéptica sobre los LLM)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
También sigo automáticamente noticias de paquetes de Python como Langchain y PydanticAI (ese tipo de proyectos refleja hasta cierto punto las tendencias reales de la industria). Ya no uso X (Twitter), pero gente como Simon Willison publica a veces también en BlueSky y Mastodon. Sebastian Raschka y Chip Huyen también publican en LinkedIn. Está todo disperso por muchos lados, pero al final terminas enterándote de la mayoría de las noticias importantes
Puede que yo mismo me haya perdido algo importante, pero las actualizaciones centrales y realmente significativas normalmente terminan mencionándose de forma natural en la portada o en los comentarios de HN
Si lo que quieres es seguir principalmente noticias de LLM y modelos de frontier AI, la lista recomendada es muy buena; más de la mitad son personas que yo también encontré por mi cuenta
Estoy siguiendo una lista de cuentas de IA en X (Twitter), y en conjunto sigue siendo la fuente de información más sólida
Algunos blogs y feeds RSS de podcasts también sirven bastante (si eres investigador, el RSS de papers en sí es imprescindible)
Lo que yo agregaría es https://epoch.ai, en podcasts Dwarkesh Patel, en blogs Peter Wildeford, @omarsar0 (DAIR elvis), y seguir directamente a varios investigadores (aunque algunos son más para entretener que para informar)
El entorno informativo de este campo está gravemente contaminado. Sobre todo si solo sigues medios como NYT, que lo tratan más desde la política, terminas con una visión sesgada e imprecisa
Ojo: en áreas de ML no directamente relacionadas con IA generativa (por ejemplo, proteínas, genómica, modelos meteorológicos, investigación en diffusion o generación de imágenes, etc.), las fuentes de información son completamente distintas
La categoría AI/ML es demasiado amplia como para seguirla toda de una sola vez
Si de verdad hay que seguirla, no necesariamente
La mayoría hace esto simplemente por curiosidad por tecnologías nuevas o por las últimas tendencias
Aun así, en áreas como el desarrollo de software, ignorar por completo la IA sí podría ser fatal para tu carrera a mediano o largo plazo (aunque basta con responder aprendiendo las herramientas mismas)
Yo la sigo de forma constante porque mi trabajo requiere entender la tendencia general
Solo con el blog de Simon Willison ya basta para aprender información reciente y de alta calidad (casi sin ruido y con la mejor relación S/N)
No hace falta seguir a la fuerza las "tendencias"
Los trabajos tech cada vez serán menos y en algún momento caerán con fuerza (la IA hará el trabajo de 10 personas con una sola, y después pasará lo mismo con white-collar y blue-collar, como los robots de centros logísticos de Amazon)
En lo personal cancelé esta semana mi suscripción a GPT Plus; ya no quiero seguir alimentando a "ese monstruo"
Para funciones como soporte de mapas (por ejemplo, rutas de viaje o recorridos en bici con amigos), la versión gratuita de Gemini incluso lo hace mejor
Si sigues solo la primera recomendación (leer el blog de simow), normalmente es más que suficiente
Las clases de Andrej Karpathy me ayudaron muchísimo
También están en YouTube (https://www.youtube.com/@AndrejKarpathy)
Yo estaba en posición de orientar y ayudar a investigadores de machine learning, pero cuando escucho la voz de Andrej siento que soy un estudiante que no sabe nada
Al principio fue raro, pero ahora esa humildad me parece un recurso valiosísimo
De verdad es importante tener esa mentalidad de "no sé nada"
T_T está demasiado difícil de leer
Si esto te parece tan ilegible, creo que el problema no está en el texto principal.
Coincido.
Un tipo de escritura que es esencial en este momento.