"El software en la era de la IA" - video de la charla de Andrej Karpathy en YC AI School

(youtube.com)

29 puntos por GN⁺ 2025-06-19 | 2 comentarios | Compartir por WhatsApp

"Software is Changing (Again)"
El paradigma del software está cambiando de forma esencial por primera vez en 70 años, y en los últimos años ha evolucionado rápidamente hacia Software 1.0 (código tradicional), 2.0 (pesos de redes neuronales) y 3.0 (LLM y prompts en lenguaje natural)
Los LLM ya no son solo una herramienta, sino un ecosistema de software comparable a un nuevo sistema operativo (Operating System), y se abre una era en la que cualquiera puede programar computadoras con lenguaje natural como el inglés
La colaboración con herramientas y agentes de IA, y la "autonomía parcial (Partial Autonomy)", se están convirtiendo en el núcleo de los productos de software del futuro, y para que sean confiables deben ir acompañadas de validación y control humano rápidos
La IA y los LLM tienen rasgos de "espíritus de personas (people spirits)", con una memoria y conocimiento enormes, pero también con limitaciones propias como alucinaciones, pérdida de contexto y riesgos de seguridad
En adelante, el software, la documentación y la infraestructura deberán rediseñarse para ser "amigables para agentes (LLM-friendly)", cambiando su estructura y forma de expresión para que los LLM puedan entenderlos y actuar sobre ellos con facilidad

Software 1.0 → 2.0 → 3.0: evolución del paradigma

Software 1.0: código fuente tradicional escrito directamente por personas
Software 2.0: modelos creados ajustando los pesos (parámetros) de redes neuronales con datasets y optimizadores
Software 3.0: programas (instrucciones) generados a partir de prompts en lenguaje natural como el inglés, basados en modelos de lenguaje grandes (LLM)

En GitHub, el código ha evolucionado recientemente hacia una forma mezclada de inglés y código, y el inglés como lenguaje de programación se está expandiendo rápidamente
Hugging Face, entre otros, cumple el papel de "GitHub" para Software 2.0 y lidera el ecosistema de modelos open source

Los LLM son un nuevo sistema operativo (OS)

Los LLM están evolucionando más allá de una simple API o utilidad hacia una plataforma en la que corre software diverso, como si fuera un sistema operativo
Actualmente, su uso ocurre en una estructura centralizada y enfocada en la nube, similar a la era de los mainframes de los años 60
También se menciona la posibilidad de que, a largo plazo, llegue la era de los LLM personales (uso distribuido y local)
El entorno de uso de los LLM se parece a las terminales e interfaces de línea de comandos tradicionales, pero una GUI de propósito general aún no está lo bastante desarrollada

Capacidades y límites de los LLM

Aunque los LLM tienen una enorme memoria y capacidad para adquirir conocimiento, también presentan defectos propios como alucinaciones (información falsa), pérdida de memoria contextual y vulnerabilidades de seguridad
La memoria de trabajo (working memory) de un LLM aún debe ser gestionada explícitamente por las personas, y su aprendizaje de contexto a largo plazo sigue siendo insuficiente
Como existen riesgos reales relacionados con seguridad, prompt injection y otros aspectos, es necesario usarlos con precaución

Autonomía parcial (Partial Autonomy) y colaboración humano-LLM

Apps basadas en LLM como Cursor y Perplexity están evolucionando mediante la combinación de operación manual tradicional y automatización con LLM, bajo la idea de un "slider de autonomía" (ajustar el grado de control del usuario o delegación a la IA)
La auditoría (audit) a través de GUI y los ciclos rápidos de verificación, junto con una metodología para mantener a la IA bajo control en ciclos cortos, son esenciales en la práctica
Se prevé que tanto el software como los productos y servicios fortalezcan gradualmente su "autonomía parcial"

Casos reales y la cultura de "Vibecoding"

Se está expandiendo la cultura de "Vibecoding", en la que cualquiera puede crear apps directamente con un LLM usando inglés
Karpathy también comparte su experiencia de haber creado en solo un día una app de iOS en un lenguaje que no conocía (Swift) y luego extenderla a un servicio real
Aunque los LLM facilitan mucho el desarrollo de prototipos, llevarlos a producción de verdad (autenticación, pagos, despliegue, etc.) sigue teniendo como cuello de botella el trabajo manual y DevOps
En adelante, una tarea clave será diseñar software y documentación amigables para agentes, para que las partes que hoy requieren clics y configuración manual puedan ser ejecutadas por un "agente"

Cambios en la documentación e infraestructura, y compatibilidad con agentes

La documentación tradicional centrada en humanos (clics, secuencias, etc.) no puede ser aprovechada de inmediato por LLM y agentes, por lo que necesita reorganizarse en formatos basados en Markdown y comandos
Vercel y Stripe, entre otros, ya comenzaron la transformación hacia documentación amigable para agentes (por ejemplo, con comandos curl)
Diversas herramientas como GitHub Ingest y DeepWiki convierten repositorios de código y documentación a formatos que los LLM pueden usar directamente

Conclusión y perspectiva

Este es el mejor momento para escribir mucho código nuevo y reescribir el existente
Los LLM, como una "herramienta complementaria (traje de Iron Man)", colaborarán con los desarrolladores humanos mientras avanza una innovación gradual hacia una mayor autonomía
En los próximos 10 años, se espera que el proceso de aumentar paso a paso el "slider de autonomía" sea la tendencia central
Los desarrolladores y las organizaciones deben apresurarse a rediseñar software, documentación e infraestructura optimizados para LLM y agentes

2 comentarios

laeyoung 2025-06-24

¡Este video está buenísimo! Menciona cuando Andrew Ng dijo que "AI Is the New Electricity", y explica que si se cae ChatGPT, que usan 800 millones de personas, es como si se fuera la electricidad; la verdad, me hizo mucho sentido.

GN⁺ 2025-06-19

Comentarios de Hacker News

Comparten la impresión de que la forma en que Karpathy usa analogías y su mirada precisa sobre la realidad son realmente muy buenas.
Señalan que es interesante la comparación en paralelo entre la programación tradicional, los pesos de redes neuronales y los prompts; por ejemplo, explican que en un módulo de conducción autónoma puede ser bastante útil optimizar una red neuronal ajustándola a un conjunto de datos que represente bien el objetivo, en lugar de escribir código directamente. Sin embargo, también enfatizan que en muchos entornos, debido a las limitaciones de hardware, el alcance de aplicación que traerán "software 2.0" o "software 3.0" será muy limitado. Comparten la visión de que el código existente y los prompts seguirán siendo herramientas complementarias, y que ninguno de los dos será una solución perfecta por sí sola.
Mencionan que Karpathy siempre ha sido alguien que piensa con claridad y que sus analogías son impresionantes. Al ver que Waymo ya podía hacer conducción autónoma continua en 2013, expresan curiosidad por saber si la razón por la que no pudo escalar tan rápido fue la regulación o la dificultad de optimizar la conducción. También comentan que en una de las diapositivas aparecía ‘AGI 2027’ y mencionan ai-2027.com.
Comparten brevemente que les sorprendió que la presentación saliera mucho antes de lo previsto.
Agradecen a YC por compartirla antes de que la charla quedara desactualizada y aportan el enlace al tuit relacionado (https://x.com/karpathy/status/1935077692258558443).