-
Últimamente, la IA para programar crea rápidamente “código que funciona”, pero se sostiene que todavía no puede crear automáticamente un “buen producto” como el que espera el usuario
-
El autor ve dos causas principales
- Falta de sentido común/conocimiento tácito en la IA
- En el aprendizaje basado en RLVR, la estructura tiende a recompensar más el “éxito al ejecutar el código” que el “buen código/producto”
-
Como ejemplos, menciona la alucinación de Sejong el Grande con una MacBook Pro, la prueba del autolavado y el fracaso al generar imágenes de un salón de clases y estudiantes en Corea, y señala que incluso los modelos más recientes pueden pasar por alto rarezas que los humanos detectan de inmediato
-
Si la recompensa del RLVR para programación se sesga hacia si el código corre o no, los LLM pueden generar
try-except, fallback y lógica defensiva en exceso, acumulando deuda técnica -
En el go, lo importante es ganar, pero en software la clave no es que “más o menos funcione”, sino que sea un “producto por el que la gente quiera pagar y que realmente desea”
-
Desde la perspectiva de AJI (Artificial Jagged Intelligence) de Karpathy, las áreas débiles de la IA actual son el “taste”, la sensibilidad de producto y el ámbito del sentido común implícito
-
Anthropic también considera que el área de diseño/taste todavía depende mucho de los humanos, aunque cree que esa frontera se está renegociando a medida que mejoran los modelos
-
El autor prevé que esta brecha se irá reduciendo gradualmente a medida que los modelos mejoren, por ejemplo de GPT-5.4 a GPT-5.5
-
En última instancia, sostiene que cuando alcance un nivel de sensibilidad y juicio difícil de distinguir del humano, pasará la prueba de Turing, y ese momento podría considerarse AGI
Resumen:
El problema de la IA para programar no es que “no sepa escribir código”, sino que está optimizada para producir resultados ejecutables sin entender qué producto quiere realmente la gente. El papel actual de los humanos es complementar el sentido común, el taste y el criterio de producto que le faltan a la IA.
10 comentarios
No sé quién es la persona que escribió el artículo, pero personalmente me pareció el texto de más bajo nivel que he leído en los últimos 10 años.
Me impactó tanto que, mientras lo leía, sentía que me quedaba atónito.
Entonces, por favor escriba usted mismo un buen artículo.
Hay partes con las que estoy de acuerdo y otras con las que no. Al final, por ahora parece correcto que la inteligencia humana siga interviniendo activamente. Incluso quienes hacen vibe coding, aunque no sepan programar, deberían desarrollar con base en la arquitectura de software o al menos en un mínimo de sentido común. A fin de cuentas, las ideas sin capacidad de gestión ni conocimiento del dominio son castillos en el aire y creo que no pueden durar mucho.
Me parece que no vale mucho la pena leerlo: se extiende sobre cosas obvias y enumera varios nombres famosos.
Yo también creo que es algo obvio.
Solo que escribí este texto porque lo he visto en la práctica y también lo he escuchado en varias comunidades.
Jajajaja
Lo mismo que se viene diciendo desde hace tiempo. Pero al final es un problema que el tiempo resolverá. ¿Seguirá igual dentro de 10 años?
Creo que es diferente.
Si algún día la IA llega a cuestionar y opinar sobre cosas que ni siquiera están en las instrucciones,
entonces de verdad podría reemplazar a los humanos, pero
algo parecido a que la gente con mucho dinero anda con chofer en vez de manejar con conducción autónoma,
¿será que el ingeniero del futuro (o sea, yo) será alguien que, cuando le digan qué hacer, se encargue de revisar todo punto por punto en su lugar?
En el nivel actual de los LLM, más importante que simplemente tener dudas es contar con el "sentido común humano".
Hace unos años, una persona famosa predijo que en el futuro los LLM podrían desarrollar en un instante lo que la gente quisiera, y que las empresas de software desaparecerían.