- En Silicon Valley se ha extendido una cultura que cree que la AGI (inteligencia artificial general) es una meta alcanzable
- Dentro de OpenAI se formó la convicción, basada en la “hipótesis del lenguaje puro”, de que escalar los modelos de lenguaje podría llevar a la AGI
- Esta creencia funciona como justificación para la expansión masiva de centros de datos y para problemas de explotación ambiental y laboral
- La lógica del valor esperado (Expected Value) de la AGI depende de estimaciones de probabilidad y valor sin fundamento, e ignora el daño ambiental real y los costos sociales
- Hace falta un enfoque de ingeniería práctico que abandone la fantasía de la AGI y resuelva problemas con modelos pequeños y orientados a objetivos
La creencia en la AGI y la cultura de OpenAI
- Personas vinculadas con OpenAI realmente creen que la AGI puede traer prosperidad o destrucción para la humanidad
- Elon Musk describió a Demis Hassabis como un “villano que quiere dominar el mundo”, y definió a OpenAI como el “bien” y a DeepMind como el “mal”
- Ilya Sutskever les decía a los empleados “sientan la AGI (Feel the AGI)” y llevó a cabo un ritual de quemar una figura de madera que simbolizaba la AGI
- Estas acciones muestran que la imaginación propia de la ciencia ficción se ha convertido en una creencia dominante en Silicon Valley
La “hipótesis del lenguaje puro” y la expansión de los LLM
- Según el libro Empire of AI de Karen Hao, GPT-2 se basó en la “hipótesis del lenguaje puro (pure language hypothesis)”
- Como los humanos piensan y se comunican mediante el lenguaje, se parte de la premisa de que la AGI sería posible solo con datos lingüísticos
- En contraste, la “hipótesis de grounding (grounding hypothesis)” sostiene que la AGI debe percibir el mundo
- La expansión exitosa de GPT a GPT-2 reforzó dentro de OpenAI la creencia de que con más datos, más parámetros del modelo y más recursos de cómputo se puede llegar a la AGI
La carrera por escalar y los problemas ambientales y laborales
- La creencia en la AGI y los resultados de los LLM justifican la construcción de centros de datos a gran escala
- Algunas instalaciones usan cientos de litros de agua por segundo y operan generadores de gas contaminantes por escasez de electricidad
- Esto provoca un consumo eléctrico al nivel de una ciudad entera y un aumento de las emisiones de CO₂
- Para lograr salidas seguras en ChatGPT, trabajadores que realizan tareas de censura y depuración de datos sufren explotación y trauma psicológico
- A medida que crece la demanda de datos, se recolecta indiscriminadamente todo internet y se controlan los resultados con RLHF (Reinforcement Learning from Human Feedback)
El problema de la lógica del valor esperado
- El valor esperado (Expected Value) se cita con frecuencia como justificación para desarrollar AGI
- La lógica es que “aunque haya una probabilidad de 0.001% de generar un valor enorme, el EV sigue siendo muy grande”
- Sin embargo, estos cálculos se basan en probabilidades y valores arbitrarios e imposibles de verificar
- En cambio, la destrucción ambiental y los costos sociales existen como valores negativos seguros y daños presentes
El giro hacia la ingeniería real
- Los tecnólogos deben resolver problemas de forma efectiva, eficiente e inocua
- El enfoque que trata a los LLM como si fueran AGI fracasa en los tres criterios
- Produce desperdicio excesivo de cómputo, explotación laboral y daño ambiental
- Es necesario salir de la fantasía de la AGI y evaluar a los LLM y a los modelos generativos como herramientas para resolver problemas específicos
- Uso de modelos generativos pequeños y orientados a objetivos o de modelos no generativos (discriminativos)
- Hace falta una ingeniería práctica basada en análisis de costo-beneficio y compensaciones técnicas
3 comentarios
Opiniones de Hacker News
Como consejo para los escépticos de la IA, conviene evitar el debate sobre el consumo de agua de los centros de datos
Expresiones como “cientos de millones de litros al año” suenan aterradoras sin contexto, pero comparadas con la agricultura o los campos de golf son una cantidad mínima
Hablar del consumo energético o de las emisiones de CO₂ está bien, pero si se enfatiza solo el uso de agua, la credibilidad del argumento general se debilita
Aunque luego me enteré de que los centros de datos a menudo usan agua potable que no puede destinarse a la agricultura
Aun así, sigo pensando que presentar cifras como “millones de galones” sin contexto sigue siendo un antipatrón
Parece el resultado de que una discusión tecnológica se haya convertido en política de identidad
En HN habría que dejar de lado las posturas políticas y debatir con base técnica
Probablemente esta actitud surgió como reacción a la exagerada publicidad de la IA
sostuvo incluso que, si surge una demanda a gran escala, la infraestructura hídrica local podría ampliarse y el precio del agua potable podría bajar
Según su comentario adicional, la crítica de que “la IA solo usa agua valiosa” en realidad estaría viendo la situación al revés
Hubo un caso en una ciudad de Chile donde un centro de datos de Google agravó la sequía local,
y en otras zonas la situación era tan seria que se mezclaba agua de mar con el agua potable
Me parece claramente problemático que consuman un volumen de agua comparable al consumo total de una ciudad
Tanto los campos de golf como los centros de datos deben pagar sus externalidades,
y si en zonas secas no resultan económicamente viables, me parece mejor así
Si es agua que puede usarse para agricultura, también puede usarse para enfriamiento
El problema del consumo energético también tiene algo de exageración: al final, la energía renovable barata será la que tenga competitividad
Creo que la limitación de los LLM es un problema de hardware
Las neuronas del cerebro humano procesan miles de entradas y salidas al mismo tiempo, mientras que las neuronas de los LLM solo tienen una entrada y una salida
El cerebro humano funciona con unos 20 W, pero un LLM necesita varios MW
Con GPU o TPU será difícil llegar a la AGI; hace falta un paradigma de hardware completamente nuevo
No es simplemente un problema de falta de capacidad de cómputo
En un entorno dedicado solo a la actividad intelectual, quizá no hagan falta tantas neuronas
El problema no es la escala, sino la arquitectura de disposición (Electronic Design Automation)
Ver artículo de Wikipedia sobre EDA
El cerebro tiene múltiples rutas de entrada y diversas formas de señalización, y su complejidad de diseño es mucho mayor
El discurso sobre la AGI parece una extensión de un impulso religioso
Los seres humanos siguen anhelando una respuesta absoluta que resuelva todos los problemas
Si se reprime, vuelve en formas peores
La meditación, la templanza y la ética hacia los demás son mi “religión” personal
Son intentos de reproducir con tecnología sistemas naturales como el sol o el cerebro
Como en la religión, las estructuras de poder usan las creencias para mantener el control
La credulidad y el fraude humanos se repiten en todas las épocas
Referencia: Extraordinary Popular Delusions and the Madness of Crowds
Una sociedad de la que desaparece la religión pasa primero por una etapa de cascarón vacío donde solo quedan los valores,
y luego cae en una etapa de no religión en la que aparece un vacío moral
Algunos intentan someterse a la IA, pero “porque lo dijo la IA” es una fe sin inspiración
Como técnico, yo también quiero una resolución de problemas eficiente e inocua, pero la realidad es compleja
Estaba configurando Bluetooth en una Raspberry Pi y lo resolví con ayuda de GPT y Claude
Stack Overflow y los foros ya no están tan activos como antes, y la documentación está dispersa
La tecnología se ha vuelto tan compleja que al final uno termina dependiendo de los LLM
pero a largo plazo una sociedad imposible de mantener sin IA no puede ser sostenible
La tecnología tiene que volver a la simplicidad
Por ejemplo, ver ArchWiki Bluetooth o Debian BluetoothUser
En las empresas ya están apareciendo estructuras donde agentes de IA ejecutan herramientas en lugar de las personas
Al final existe un gran riesgo de que los humanos ya no entiendan la lógica interna
Pero todavía tienen limitaciones fundamentales para reemplazar por completo a los humanos
Al final, es muy probable que los LLM sigan el mismo camino
Parte de la industria sostiene que los LLM son un callejón sin salida fundamental,
pero por estar atada a las acciones y al prestigio no reconoce la realidad
los LLM también podrían ser una tecnología intermedia hacia la AGI
Podrían convertirse en un componente clave de un sistema AGI
Gracias a Whisper, mi trabajo de subtitulado de videos se acortó de forma revolucionaria
Lo que antes me tomaba horas ahora se termina en minutos
Y MacWhisper, con su buena interfaz, también mejoró mucho la accesibilidad
Por ejemplo, hay casos de abogados que usan LLM para encontrar pruebas exculpatorias
Más que una expansión excesiva, lo importante es el uso práctico
En pocos años llegará una era en la que los LLM personales correrán a nivel laptop
Me parece exagerado decir que se explota a los moderadores de contenido
Este es un trabajo de moderación de internet que existe desde hace 30 años
Puede ser desagradable, pero no es algo nuevo ni particularmente horroroso
Es un rol necesario, independientemente de la búsqueda de AGI
Da gusto ver una discusión realista sobre IA
No se trata de que la tecnología transformer en sí no sirva,
sino de que el problema es la exageración excesiva de que “la AGI ya casi llega”
HN ha resistido bien la mayoría de las modas, pero esta vez parece una excepción
Debemos intentarlo no porque sea fácil, sino porque es difícil
Aunque la AGI sea una fantasía, en el proceso podrían resolverse problemas útiles
Las emisiones de carbono de los centros de datos tienen bastante de exageración,
y a largo plazo los centros de datos basados en energía limpia serán más económicos
Y eso es una carga directa para la gente común
La IA actual no resulta muy convincente en ese punto
DeepMind y Demis Hassabis sí están logrando resultados científicos reales
Ej.: AlphaFold, AlphaEvolve, etc.
Existiendo investigaciones así, no es justo decir simplemente que “la IA es una fantasía”
La idea central del texto es criticar la obsesión con la AGI
Hassabis da la impresión de estar sinceramente interesado en el avance de la ciencia
En cambio, algunas empresas parecen más bien PR para hacer dinero
Están hablando de AGI, pero al final todos están contando lo que ellos mismos hicieron.
En vez de sacar cosas raras sobre la ingeniería, como temas de explotación ambiental y laboral, mejor sería publicar un reporte diciendo que se va a ir al diablo y demostrarlo poniéndose en corto..