29 puntos por GN⁺ 2025-06-19 | 2 comentarios | Compartir por WhatsApp
  • "Software is Changing (Again)"
  • El paradigma del software está cambiando de forma esencial por primera vez en 70 años, y en los últimos años ha evolucionado rápidamente hacia Software 1.0 (código tradicional), 2.0 (pesos de redes neuronales) y 3.0 (LLM y prompts en lenguaje natural)
  • Los LLM ya no son solo una herramienta, sino un ecosistema de software comparable a un nuevo sistema operativo (Operating System), y se abre una era en la que cualquiera puede programar computadoras con lenguaje natural como el inglés
  • La colaboración con herramientas y agentes de IA, y la "autonomía parcial (Partial Autonomy)", se están convirtiendo en el núcleo de los productos de software del futuro, y para que sean confiables deben ir acompañadas de validación y control humano rápidos
  • La IA y los LLM tienen rasgos de "espíritus de personas (people spirits)", con una memoria y conocimiento enormes, pero también con limitaciones propias como alucinaciones, pérdida de contexto y riesgos de seguridad
  • En adelante, el software, la documentación y la infraestructura deberán rediseñarse para ser "amigables para agentes (LLM-friendly)", cambiando su estructura y forma de expresión para que los LLM puedan entenderlos y actuar sobre ellos con facilidad

Software 1.0 → 2.0 → 3.0: evolución del paradigma

  • Software 1.0: código fuente tradicional escrito directamente por personas
  • Software 2.0: modelos creados ajustando los pesos (parámetros) de redes neuronales con datasets y optimizadores
  • Software 3.0: programas (instrucciones) generados a partir de prompts en lenguaje natural como el inglés, basados en modelos de lenguaje grandes (LLM)
  • En GitHub, el código ha evolucionado recientemente hacia una forma mezclada de inglés y código, y el inglés como lenguaje de programación se está expandiendo rápidamente
  • Hugging Face, entre otros, cumple el papel de "GitHub" para Software 2.0 y lidera el ecosistema de modelos open source

Los LLM son un nuevo sistema operativo (OS)

  • Los LLM están evolucionando más allá de una simple API o utilidad hacia una plataforma en la que corre software diverso, como si fuera un sistema operativo
  • Actualmente, su uso ocurre en una estructura centralizada y enfocada en la nube, similar a la era de los mainframes de los años 60
  • También se menciona la posibilidad de que, a largo plazo, llegue la era de los LLM personales (uso distribuido y local)
  • El entorno de uso de los LLM se parece a las terminales e interfaces de línea de comandos tradicionales, pero una GUI de propósito general aún no está lo bastante desarrollada

Capacidades y límites de los LLM

  • Aunque los LLM tienen una enorme memoria y capacidad para adquirir conocimiento, también presentan defectos propios como alucinaciones (información falsa), pérdida de memoria contextual y vulnerabilidades de seguridad
  • La memoria de trabajo (working memory) de un LLM aún debe ser gestionada explícitamente por las personas, y su aprendizaje de contexto a largo plazo sigue siendo insuficiente
  • Como existen riesgos reales relacionados con seguridad, prompt injection y otros aspectos, es necesario usarlos con precaución

Autonomía parcial (Partial Autonomy) y colaboración humano-LLM

  • Apps basadas en LLM como Cursor y Perplexity están evolucionando mediante la combinación de operación manual tradicional y automatización con LLM, bajo la idea de un "slider de autonomía" (ajustar el grado de control del usuario o delegación a la IA)
  • La auditoría (audit) a través de GUI y los ciclos rápidos de verificación, junto con una metodología para mantener a la IA bajo control en ciclos cortos, son esenciales en la práctica
  • Se prevé que tanto el software como los productos y servicios fortalezcan gradualmente su "autonomía parcial"

Casos reales y la cultura de "Vibecoding"

  • Se está expandiendo la cultura de "Vibecoding", en la que cualquiera puede crear apps directamente con un LLM usando inglés
  • Karpathy también comparte su experiencia de haber creado en solo un día una app de iOS en un lenguaje que no conocía (Swift) y luego extenderla a un servicio real
  • Aunque los LLM facilitan mucho el desarrollo de prototipos, llevarlos a producción de verdad (autenticación, pagos, despliegue, etc.) sigue teniendo como cuello de botella el trabajo manual y DevOps
  • En adelante, una tarea clave será diseñar software y documentación amigables para agentes, para que las partes que hoy requieren clics y configuración manual puedan ser ejecutadas por un "agente"

Cambios en la documentación e infraestructura, y compatibilidad con agentes

  • La documentación tradicional centrada en humanos (clics, secuencias, etc.) no puede ser aprovechada de inmediato por LLM y agentes, por lo que necesita reorganizarse en formatos basados en Markdown y comandos
  • Vercel y Stripe, entre otros, ya comenzaron la transformación hacia documentación amigable para agentes (por ejemplo, con comandos curl)
  • Diversas herramientas como GitHub Ingest y DeepWiki convierten repositorios de código y documentación a formatos que los LLM pueden usar directamente

Conclusión y perspectiva

  • Este es el mejor momento para escribir mucho código nuevo y reescribir el existente
  • Los LLM, como una "herramienta complementaria (traje de Iron Man)", colaborarán con los desarrolladores humanos mientras avanza una innovación gradual hacia una mayor autonomía
  • En los próximos 10 años, se espera que el proceso de aumentar paso a paso el "slider de autonomía" sea la tendencia central
  • Los desarrolladores y las organizaciones deben apresurarse a rediseñar software, documentación e infraestructura optimizados para LLM y agentes

2 comentarios

 
laeyoung 2025-06-24

¡Este video está buenísimo! Menciona cuando Andrew Ng dijo que "AI Is the New Electricity", y explica que si se cae ChatGPT, que usan 800 millones de personas, es como si se fuera la electricidad; la verdad, me hizo mucho sentido.

 
GN⁺ 2025-06-19
Comentarios de Hacker News
  • Comparten la impresión de que la forma en que Karpathy usa analogías y su mirada precisa sobre la realidad son realmente muy buenas.
  • Señalan que es interesante la comparación en paralelo entre la programación tradicional, los pesos de redes neuronales y los prompts; por ejemplo, explican que en un módulo de conducción autónoma puede ser bastante útil optimizar una red neuronal ajustándola a un conjunto de datos que represente bien el objetivo, en lugar de escribir código directamente. Sin embargo, también enfatizan que en muchos entornos, debido a las limitaciones de hardware, el alcance de aplicación que traerán "software 2.0" o "software 3.0" será muy limitado. Comparten la visión de que el código existente y los prompts seguirán siendo herramientas complementarias, y que ninguno de los dos será una solución perfecta por sí sola.
  • Mencionan que Karpathy siempre ha sido alguien que piensa con claridad y que sus analogías son impresionantes. Al ver que Waymo ya podía hacer conducción autónoma continua en 2013, expresan curiosidad por saber si la razón por la que no pudo escalar tan rápido fue la regulación o la dificultad de optimizar la conducción. También comentan que en una de las diapositivas aparecía ‘AGI 2027’ y mencionan ai-2027.com.
  • Comparten brevemente que les sorprendió que la presentación saliera mucho antes de lo previsto.
  • Agradecen a YC por compartirla antes de que la charla quedara desactualizada y aportan el enlace al tuit relacionado (https://x.com/karpathy/status/1935077692258558443).