- "Software is Changing (Again)"
- El paradigma del software está cambiando de forma esencial por primera vez en 70 años, y en los últimos años ha evolucionado rápidamente hacia Software 1.0 (código tradicional), 2.0 (pesos de redes neuronales) y 3.0 (LLM y prompts en lenguaje natural)
- Los LLM ya no son solo una herramienta, sino un ecosistema de software comparable a un nuevo sistema operativo (Operating System), y se abre una era en la que cualquiera puede programar computadoras con lenguaje natural como el inglés
- La colaboración con herramientas y agentes de IA, y la "autonomía parcial (Partial Autonomy)", se están convirtiendo en el núcleo de los productos de software del futuro, y para que sean confiables deben ir acompañadas de validación y control humano rápidos
- La IA y los LLM tienen rasgos de "espíritus de personas (people spirits)", con una memoria y conocimiento enormes, pero también con limitaciones propias como alucinaciones, pérdida de contexto y riesgos de seguridad
- En adelante, el software, la documentación y la infraestructura deberán rediseñarse para ser "amigables para agentes (LLM-friendly)", cambiando su estructura y forma de expresión para que los LLM puedan entenderlos y actuar sobre ellos con facilidad
Software 1.0 → 2.0 → 3.0: evolución del paradigma
- Software 1.0: código fuente tradicional escrito directamente por personas
- Software 2.0: modelos creados ajustando los pesos (parámetros) de redes neuronales con datasets y optimizadores
- Software 3.0: programas (instrucciones) generados a partir de prompts en lenguaje natural como el inglés, basados en modelos de lenguaje grandes (LLM)
- En GitHub, el código ha evolucionado recientemente hacia una forma mezclada de inglés y código, y el inglés como lenguaje de programación se está expandiendo rápidamente
- Hugging Face, entre otros, cumple el papel de "GitHub" para Software 2.0 y lidera el ecosistema de modelos open source
Los LLM son un nuevo sistema operativo (OS)
- Los LLM están evolucionando más allá de una simple API o utilidad hacia una plataforma en la que corre software diverso, como si fuera un sistema operativo
- Actualmente, su uso ocurre en una estructura centralizada y enfocada en la nube, similar a la era de los mainframes de los años 60
- También se menciona la posibilidad de que, a largo plazo, llegue la era de los LLM personales (uso distribuido y local)
- El entorno de uso de los LLM se parece a las terminales e interfaces de línea de comandos tradicionales, pero una GUI de propósito general aún no está lo bastante desarrollada
Capacidades y límites de los LLM
- Aunque los LLM tienen una enorme memoria y capacidad para adquirir conocimiento, también presentan defectos propios como alucinaciones (información falsa), pérdida de memoria contextual y vulnerabilidades de seguridad
- La memoria de trabajo (working memory) de un LLM aún debe ser gestionada explícitamente por las personas, y su aprendizaje de contexto a largo plazo sigue siendo insuficiente
- Como existen riesgos reales relacionados con seguridad, prompt injection y otros aspectos, es necesario usarlos con precaución
Autonomía parcial (Partial Autonomy) y colaboración humano-LLM
- Apps basadas en LLM como Cursor y Perplexity están evolucionando mediante la combinación de operación manual tradicional y automatización con LLM, bajo la idea de un "slider de autonomía" (ajustar el grado de control del usuario o delegación a la IA)
- La auditoría (audit) a través de GUI y los ciclos rápidos de verificación, junto con una metodología para mantener a la IA bajo control en ciclos cortos, son esenciales en la práctica
- Se prevé que tanto el software como los productos y servicios fortalezcan gradualmente su "autonomía parcial"
Casos reales y la cultura de "Vibecoding"
- Se está expandiendo la cultura de "Vibecoding", en la que cualquiera puede crear apps directamente con un LLM usando inglés
- Karpathy también comparte su experiencia de haber creado en solo un día una app de iOS en un lenguaje que no conocía (Swift) y luego extenderla a un servicio real
- Aunque los LLM facilitan mucho el desarrollo de prototipos, llevarlos a producción de verdad (autenticación, pagos, despliegue, etc.) sigue teniendo como cuello de botella el trabajo manual y DevOps
- En adelante, una tarea clave será diseñar software y documentación amigables para agentes, para que las partes que hoy requieren clics y configuración manual puedan ser ejecutadas por un "agente"
Cambios en la documentación e infraestructura, y compatibilidad con agentes
- La documentación tradicional centrada en humanos (clics, secuencias, etc.) no puede ser aprovechada de inmediato por LLM y agentes, por lo que necesita reorganizarse en formatos basados en Markdown y comandos
- Vercel y Stripe, entre otros, ya comenzaron la transformación hacia documentación amigable para agentes (por ejemplo, con comandos
curl)
- Diversas herramientas como GitHub Ingest y DeepWiki convierten repositorios de código y documentación a formatos que los LLM pueden usar directamente
Conclusión y perspectiva
- Este es el mejor momento para escribir mucho código nuevo y reescribir el existente
- Los LLM, como una "herramienta complementaria (traje de Iron Man)", colaborarán con los desarrolladores humanos mientras avanza una innovación gradual hacia una mayor autonomía
- En los próximos 10 años, se espera que el proceso de aumentar paso a paso el "slider de autonomía" sea la tendencia central
- Los desarrolladores y las organizaciones deben apresurarse a rediseñar software, documentación e infraestructura optimizados para LLM y agentes
2 comentarios
¡Este video está buenísimo! Menciona cuando Andrew Ng dijo que "AI Is the New Electricity", y explica que si se cae ChatGPT, que usan 800 millones de personas, es como si se fuera la electricidad; la verdad, me hizo mucho sentido.
Comentarios de Hacker News