Mi propia forma de seguirle el paso al avance de la IA (y por qué tú también deberías hacerlo)

(blog.nilenso.com)

87 puntos por GN⁺ 2025-07-21 | 5 comentarios | Compartir por WhatsApp

La IA generativa es la tecnología que evoluciona más rápido, y tanto subestimarla como sobreestimarla es peligroso
Seguir de forma constante fuentes con autoridad y expertos confiables es indispensable
Se recomienda una canalización de información equilibrada como Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought
Los anuncios oficiales de laboratorios de IA, blogs de ingeniería y papers son esenciales para entender el progreso real de la tecnología y sus límites
Con canales diversos como Twitter/X, curación de noticias y listas de expertos, es posible acceder tanto a las tendencias más recientes como a análisis profundos

Introducción: malentendidos sobre la IA y contaminación informativa

La IA generativa es la tecnología que avanza más rápido que el autor ha visto en su vida
Pero también están muy extendidos los malentendidos sobre la IA, y el entorno informativo en sí es extremadamente caótico
Ya existen casos reales en los que empresas, gobiernos o personas que no entienden suficientemente esta tecnología la usan mal o provocan daños graves
Existen malentendidos en ambos extremos: subestimarla (tratarla como “una moda pasajera”) o sobreestimarla (“ya no se necesitarán programadores”)
La raíz de estas confusiones es la falta de una comprensión correcta de la tecnología

Enfoque para adquirir información sobre IA

Entender correctamente la información relacionada con IA no es tan fácil como parece
Vivimos en un entorno donde estamos expuestos de forma cotidiana a información distorsionada, exagerada o reprimida
Si no se filtra la información de forma intencional y sistemática, existe alto riesgo de quedar expuesto a errores, exageraciones y distorsiones
El autor ha construido una canalización de información equilibrada que le ha sido útil, y la recomienda como un buen punto de partida para principiantes

Principios generales para informarse

Es importante consultar información lo más cercana posible a la fuente original
- Hay que revisar como fuentes primarias los anuncios oficiales de los laboratorios de IA y las opiniones de figuras clave
- Hace falta una actitud de no confiar ciegamente en coberturas de segunda o tercera mano
También hay que buscar activamente y apoyarse en los comentarios de expertos confiables

Puntos de partida recomendados

Simon Willison’s Blog
- Simon Willison’s Blog (etiqueta AI)
- El punto de partida más recomendado para técnicos, cubre ampliamente la frontera de la IA, aplicaciones, seguridad y cuestiones éticas
- También es conocido como creador de Django y Datasette
- Ejemplos: The Lethal Trifecta, LLMs in 2024
Andrej Karpathy
- Twitter/X | YouTube
- Miembro fundador de OpenAI y exdirector de AI en Tesla
- Es uno de los mejores canales para aprender de forma sencilla la estructura interna y los principios de los modelos de IA, además de observar su impacto cultural y los cambios sociales que provoca
- Ejemplos: Deep Dive into LLMs like ChatGPT, How I Use LLMs

Every’s Chain of Thought

Every’s Chain of Thought
Lo escribe Dan Shipper (cofundador de Every) y ofrece experiencia práctica de uso de IA y vivencias reales con modelos más allá de los benchmarks
Ejemplos: Vibe Check: Codex, Vibe Check: o3

Cómo monitorear materiales oficiales de laboratorios de IA

Revisar periódicamente blogs oficiales, noticias, model cards, guías de ingeniería y papers de OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) y otros
- Ejemplos: anuncio oficial de OpenAI o3, Claude 4 System Card
- Blogs de ingeniería: Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- Ejemplos de papers: paper de DeepSeek R1, paper de Anthropic Biology
Laboratorios pequeños: también vale la pena seguir Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire

Expertos en IA e ingenieros prácticos a seguir

La información de expertos que crean herramientas open source y tienen experiencia práctica en ingeniería de IA muchas veces resulta más útil en la práctica que las guías oficiales

Figuras y blogs recomendados

Hamel Husain
- Your AI Product Needs Evals, LLM Eval FAQ
Shreya Shankar
- Data Flywheels for LLM Applications, Short Musings on AI Engineering and “Failed AI Projects”
Jason Liu
- The RAG Playbook, Common RAG Mistakes
Eugene Yan
- Task-Specific LLM Evals that Do & Don’t Work, AlignEval, Intuition on Attention
What We’ve Learned From A Year of Building with LLMs
- Archivo de casos de uso de LLM escrito por personas con experiencia real de implementación
Chip Huyen
- Common pitfalls when building generative AI applications, Agents
Omar Khattab (Twitter)
- A Guide to Large Language Model Abstractions, post de Twitter
Kwindla Hultman Kramer (Twitter)
- Voice AI and Voice Agents: An Illustrated Primer, Advice on Building Voice AI in June 2025
Han Chung Lee
- MCP is not REST API, Poking around Claude Code, MLOps Lessons from ChatGPT’s ‘Sycophantic’ Rollback
Jo Kristian Bergum
- Search is the natural abstraction for augmenting AI with moving context
David Crawshaw
- How I program with LLMs, How I program with Agents
Alexander Doria / Pierre Carl-Langlais
- The Model is the Product, A Realistic AI Timeline
Nathan Lambert’s “Interconnects”
- What comes next with Reinforcement Learning, Reinforcement learning with random rewards actually works with Qwen 2.5
Ethan Mollick
- Using AI Right Now: A Quick Guide, Making AI Work: Leadership, Lab, and Crowd
AI Snake Oil – Arvind Narayanan & Sayash Kapoor
- AGI is not a milestone, Evaluating LLMs is a minefield

Uso de noticias/medios y comunidades de IA

Twitter/X
- Lista de Twitter/X
- Centro de las discusiones e información en tiempo real sobre IA, útil para detectar novedades y debates
  - Se puede consumir el feed de Twitter como si se leyera el periódico durante 15 a 20 minutos, y seguir más personas o fuentes cuando haga falta
Shawn Wang(swyx) / smol.ai
- Twitter de swyx | AI News by smol.ai
- newsletter Latent Space
- Ofrece un resumen diario de tendencias de IA como fuente alternativa a Twitter
Dwarkesh Patel
- blog/podcast de Dwarkesh Patel

Comunidades para discusión profunda y materiales sobre IA

LessWrong (AI Alignment), AI Alignment Forum: seguridad de IA, gobernanza, análisis técnico y más
- Ahí aparecen muchas discusiones complejas que no suelen tratarse en espacios más mainstream como Twitter
- Ejemplos: Claude plays Pokémon breakdown, The Waluigi Effect
Gwern: textos profundos casi enciclopédicos sobre IA, LLM y transformers
- Ofrece una gran cantidad de textos relacionados con IA e insights predictivos sobre temas como el escalado de LLM
- Ejemplos: The Scaling Hypothesis, tutorial You could have invented transformers
Prompt Whisperers/Latent space explorers
- blog de Janus, Twitter de Wyatt Walls, Claude Backrooms
- Ejemplos: Anomalous tokens reveal the original identities of Instruct models, the void

Formas prácticas de informarse

No hace falta seguir perfectamente todas las fuentes; una forma práctica es leer el feed de Twitter como si fuera el periódico
Si se encuentra un texto interesante, también se recomienda seguir a su autor y revisar sus otros trabajos, expandiendo así la exploración
Es una forma de explorar información parecida a como antes se descubría música
Si se aborda como una exploración intelectual divertida, puede convertirse en placer y no en obligación

Conclusión y lista recomendada

A través de la lista de Twitter/X incluida, es posible seguir de una sola vez a los expertos y practicantes mencionados arriba
Próximamente también se añadirá una lista en formato RSS

Ir directamente a la lista de Twitter

5 comentarios

GN⁺ 2025-07-21

Comentarios de Hacker News

Creo que si entiendes de forma básica cómo funcionan los LLM, no hace falta seguir todo el flujo constante de contenido de PR, blogueros, líderes de la industria y pensadores de internet
De hecho, si sigues esas entrevistas o textos, corres el riesgo de terminar persiguiendo modas raras que en realidad no ayudan
En la práctica, las diferencias entre modelos solo han sido cuestión de unos cuantos años, pero no de diferencias esenciales grandes; actualmente la mayoría de los cambios ocurren en herramientas o trabajo de integración
Hay que recordar siempre que los LLM al final son "modelos de texto" y se generan sin conocimiento subyacente; así puedes distinguir dónde son útiles y dónde no son adecuados
- De verdad estoy de acuerdo con esta opinión; también sentí que la lista de "señales clave (high signal)" de ese blog en realidad está compuesta sobre todo por figuras de autopromoción (aunque claro, algunos sí son buenos), así que se siente más cercana al "buzz" que al insight
  Personalmente tampoco conecto mucho con la afirmación de que "la IA ha sido la tecnología que más rápido avanzó en toda mi vida"
  Yo viví la época en que SVM estaba de moda, cuando las "redes neuronales eran un chiste", y luego los más de 10 años en los que deep learning y varios frameworks de DL explotaron en cantidad
  En ese tiempo también hubo avances realmente drásticos en una década
  En la web pasó algo similar: JS era solo para complementar la UX y luego las single-page apps se volvieron el estándar
  El punto clave es que, a menos que vayas a entrar en una "lista de influencers clave", una estrategia mucho mejor es simplemente esperar con calma hasta que llegue el momento importante para ti
  Yo también ignoré durante 10 años todas las tendencias de desarrollo web desde la era de backbone.js, y cuando de verdad necesité React, estudié unos cuantos días y pude usarlo de inmediato
  Hace 5 años todo el mundo quería aprender a implementar LSTM, pero ahora ya quedó anticuado por culpa de los transformers
  Lo que he sentido durante toda mi carrera es que "moverse rápido" significa "no está maduro"
  De hecho, aprender modelos estadísticos más antiguos (como GLM) y cómo seguir usándolos de forma práctica da soluciones mucho más productivas en el trabajo real que andar persiguiendo el "prompt hack" de moda
- Si entiendes más o menos la estructura de los LLM, casi todas las novedades sobre LLM caen en dos categorías
  La primera son herramientas nuevas que son un poco distintas de las existentes o tienen un rendimiento un poco mejor (si traen una función que no existía, puede valer la pena, pero la mayoría pronto queda obsoleta)
  Nombres como Kimi-K2 o GPT 4.1 podrían no ser mencionados por nadie dentro de unos meses
  La segunda es cuando de verdad se agrega una capacidad nueva al modelo
  Por ejemplo, RL (reinforcement learning), chain of thought, agentes de código que realmente funcionan, modelos multimodales de nivel top y conexiones inteligentes con herramientas
  Basta con poner atención cuando aparezcan esos grandes saltos
  En la práctica, con solo revisar publicaciones de HN con más de 500 puntos ya vas entendiendo naturalmente el flujo actual
  Creo que la mejor forma de aprender las capacidades reales de los LLM no es con blogs o videos, sino creando cosas tú mismo y enfrentándote directamente a los problemas
- Totalmente de acuerdo. Siempre les insisto esto a mis estudiantes
  - 1. No se obsesionen demasiado con la experiencia ajena; concéntrense en su propia experiencia directa
  - 2. En vez de leer blogs, construyan una app ustedes mismos
  - 3. Como la experiencia de cada quien varía muchísimo, no sigan sin más lo que piensan otros
  - 4. No persigan ciegamente a investigadores o desarrolladores en Twitter o Substack (la mayoría está mostrando su escaparate)
  - 5. No desperdicien tiempo en ansiedad o FOMO; aprendan haciendo. Los cambios realmente importantes de todos modos los van a conocer tarde o temprano
  - 6. Conocer información es importante, pero no se apeguen de forma obsesiva a la información en sí. Hay que repartir el tiempo de manera inteligente. Siempre remarco este punto a mis estudiantes
- En realidad esto también aplica al mundo de la investigación
  La investigación, por naturaleza, avanza 99% de forma incremental (y eso está bien; no hay que frustrarse por ello)
  La mayoría de los papers son más largos de lo necesario y, si los lees bien, con solo intuición matemática puedes predecir bastante (si entiendes la idea, más o menos anticipas el resultado)
  Es fácil sentir que el campo cambia rápido, pero en realidad no va tan rápido como parece
  Yo mismo me tomé un año por asuntos personales y, al volver, me di cuenta de que no había cambiado tanto
  Tener esta perspectiva te libera de la presión de "mantenerte al día"
  Si ahora te cuesta, eso solo significa que todavía te falta un poco de especialización, no que te hayas quedado atrás
  Igual que cualquiera debe aprender a correr para poder seguir aunque sea un paso detrás, esa prisa no es más que una preocupación dentro de mi cabeza
- Cuando explico los LLM, la parte que más interesa no es la arquitectura sino la "predicción token por token (autoregresión)" y el hecho de que no necesariamente se elige el token con mayor probabilidad, sino que se hace un muestreo proporcional a esa probabilidad
  El algoritmo central real (la forma de predecir el siguiente token) no le dice mucho a la mayoría de quienes no son del área
  A nadie le importan detalles como dot product o embedding. Aunque se expliquen, cuesta que se queden y no ayudan demasiado
No hace falta seguir sí o sí las "últimas tendencias"; creo que conviene mantener un interés relajado e ir probando selectivamente solo las funciones o técnicas que de verdad mejoren mi eficiencia, acumulando solo lo que sí sirve (no confío mucho en cosas como "alguien recomendó X en X"). De hecho, pude aprender mucho escuchando a investigadores con una visión crítica del hype de la IA [https://x.com/burkov]. Ahora mismo hay demasiada exageración, cambio e incertidumbre. Si aparece una innovación real, seguro se va a escuchar en HN (o en la comunidad principal)
- Usarlo tú mismo aunque sea unas horas vale mucho más como aprendizaje que pasarte horas leyendo materiales
Siento que el texto no explica bien el "por qué", así que el "cómo" de la lista no resulta convincente. Mi tiempo valioso puede usarse perfectamente en otra cosa
- De verdad me pregunto si hace falta "mantenerse al día" con algo de forma constante. Las innovaciones que tienen significado práctico al final se masifican y terminan llegando naturalmente también a mí. Con Excel o Google Docs me pasó eso: al principio no me interesaban mucho, y aun después de que se masificaron pude aprenderlos y usarlos perfectamente bien. Salvo casos como una startup de IA a la que le queda muy poco runway y por eso sí hay una razón clara para correr, no hace falta desesperarse
Estoy suscrito al newsletter "Pragmatic Engineer" de Gergeley Orosz (últimamente con muchos temas de IA) y también reviso el Substack de Gary Marcus (con una mirada más escéptica sobre los LLM)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
También sigo automáticamente noticias de paquetes de Python como Langchain y PydanticAI (ese tipo de proyectos refleja hasta cierto punto las tendencias reales de la industria). Ya no uso X (Twitter), pero gente como Simon Willison publica a veces también en BlueSky y Mastodon. Sebastian Raschka y Chip Huyen también publican en LinkedIn. Está todo disperso por muchos lados, pero al final terminas enterándote de la mayoría de las noticias importantes
Puede que yo mismo me haya perdido algo importante, pero las actualizaciones centrales y realmente significativas normalmente terminan mencionándose de forma natural en la portada o en los comentarios de HN
- Intentar seguir el ritmo de la industria es como subirse a una caminadora que va a 140 km/h. Simplemente renuncié a correr en ella. Sí estoy de acuerdo en que la IA (sobre todo los LLM) no es una moda pasajera, pero ahora mismo el cambio es demasiado brusco. No pienso invertirle mucho tiempo hasta que de verdad me haga falta. Espero que en unos años el panorama de la industria esté más claro. Y aunque no sea así, al menos me habré ahorrado desperdiciar tiempo en tendencias que rápido dejan de tener sentido. Para referencia, actualmente no uso IA ni LLM en mi trabajo real para nada
- Como las empresas han metido inversiones enormes y mucho R&D, en realidad no intentan ocultar su tecnología (es lo contrario del secretismo)
- Yo enfrento así todas las tendencias del campo de TI en general
Si lo que quieres es seguir principalmente noticias de LLM y modelos de frontier AI, la lista recomendada es muy buena; más de la mitad son personas que yo también encontré por mi cuenta
Estoy siguiendo una lista de cuentas de IA en X (Twitter), y en conjunto sigue siendo la fuente de información más sólida
Algunos blogs y feeds RSS de podcasts también sirven bastante (si eres investigador, el RSS de papers en sí es imprescindible)
Lo que yo agregaría es https://epoch.ai, en podcasts Dwarkesh Patel, en blogs Peter Wildeford, @omarsar0 (DAIR elvis), y seguir directamente a varios investigadores (aunque algunos son más para entretener que para informar)
El entorno informativo de este campo está gravemente contaminado. Sobre todo si solo sigues medios como NYT, que lo tratan más desde la política, terminas con una visión sesgada e imprecisa
Ojo: en áreas de ML no directamente relacionadas con IA generativa (por ejemplo, proteínas, genómica, modelos meteorológicos, investigación en diffusion o generación de imágenes, etc.), las fuentes de información son completamente distintas
La categoría AI/ML es demasiado amplia como para seguirla toda de una sola vez
Si de verdad hay que seguirla, no necesariamente
La mayoría hace esto simplemente por curiosidad por tecnologías nuevas o por las últimas tendencias
Aun así, en áreas como el desarrollo de software, ignorar por completo la IA sí podría ser fatal para tu carrera a mediano o largo plazo (aunque basta con responder aprendiendo las herramientas mismas)
Yo la sigo de forma constante porque mi trabajo requiere entender la tendencia general
Solo con el blog de Simon Willison ya basta para aprender información reciente y de alta calidad (casi sin ruido y con la mejor relación S/N)
- Si apoyas a Simon en GitHub ($10 o más), puedes recibir por correo una "versión resumida con menos volumen"
  
  "Resumen de los avances más importantes del último mes en el campo de los LLM (se lee en menos de 10 minutos)"
  https://simonwillison.net/about/
- https://simonwillison.net
- Por suerte también ofrece feed RSS, así que puedes revisar tanto código como noticias
No hace falta seguir a la fuerza las "tendencias"
- Sí, ya es hora de dejarlo y probar otra cosa
- En realidad, una opción es simplemente salir de la industria tech y construir una nueva carrera
  Los trabajos tech cada vez serán menos y en algún momento caerán con fuerza (la IA hará el trabajo de 10 personas con una sola, y después pasará lo mismo con white-collar y blue-collar, como los robots de centros logísticos de Amazon)
  En lo personal cancelé esta semana mi suscripción a GPT Plus; ya no quiero seguir alimentando a "ese monstruo"
  Para funciones como soporte de mapas (por ejemplo, rutas de viaje o recorridos en bici con amigos), la versión gratuita de Gemini incluso lo hace mejor
Si sigues solo la primera recomendación (leer el blog de simow), normalmente es más que suficiente
- Incluso eso me da flojera, así que lo sustituyo con videos de Fireship junto al café de la mañana
- Súper recomendado: resumen de muy buena calidad y casi sin clickbait
Las clases de Andrej Karpathy me ayudaron muchísimo
También están en YouTube (https://www.youtube.com/@AndrejKarpathy)
Yo estaba en posición de orientar y ayudar a investigadores de machine learning, pero cuando escucho la voz de Andrej siento que soy un estudiante que no sabe nada
Al principio fue raro, pero ahora esa humildad me parece un recurso valiosísimo
De verdad es importante tener esa mentalidad de "no sé nada"

makers 2025-07-22

T_T está demasiado difícil de leer

reagea0 2025-07-23

Si esto te parece tan ilegible, creo que el problema no está en el texto principal.

harris 2025-07-28

Coincido.

supermaxi 2025-07-22

Un tipo de escritura que es esencial en este momento.