Sobre la AGI desigual (Jagged): o3, Gemini 2.5 y las IA que vienen después

(oneusefulthing.org)

4 puntos por GN⁺ 2025-04-22 | 2 comentarios | Compartir por WhatsApp

La definición de AGI sigue siendo poco clara, y con las pruebas tradicionales centradas en humanos es difícil medir adecuadamente la inteligencia o creatividad de la IA
OpenAI o3 y Google Gemini 2.5 muestran un nivel muy alto en la ejecución de tareas reales y tienen un rendimiento cercano a la AGI
o3 es un modelo agéntico que puede resolver objetivos complejos usando herramientas, y de ahí surge el concepto de Jagged AGI
La IA puede resolver tareas difíciles y aun así cometer errores en problemas básicos, por lo que sus capacidades son desiguales, algo que se explica con la idea de Jagged Frontier
Como el uso e integración de la tecnología avanzan más lento que la tecnología misma, incluso si la AGI se materializa, es posible que los cambios sociales tomen tiempo

¿De verdad ya llegamos a la AGI?

Hoy en día, los métodos para medir la inteligencia, creatividad o empatía de la IA son imprecisos y en su mayoría se basan en criterios pensados para humanos
Incluso el Test de Turing ya puede ser superado por la IA, pero el significado de ese resultado sigue siendo ambiguo
El concepto de AGI existe desde hace mucho tiempo, pero aún no hay consenso sobre qué criterios debe cumplir algo para llamarse AGI
También se usan de forma experimental contenidos de video y resúmenes de documentos creados únicamente con IA para explicar el concepto de AGI

El rendimiento que mostraron o3 y Gemini 2.5

o3 de OpenAI y Gemini 2.5 Pro de Google son modelos recientes que muestran una mejora de rendimiento extraordinaria
Con un solo prompt pueden realizar de principio a fin tareas que van desde redactar slogans de marketing hasta crear un sitio web
Sin instrucciones explícitas, o3 puede llevar a cabo automáticamente tareas compuestas como usar herramientas, navegar por la web y programar
También muestra un rendimiento al nivel humano o superior en funciones como la de 'geo-guesser', donde estima una ubicación a partir de una imagen
El análisis de datos y la generación de reportes también pueden hacerse con un solo comando, incluyendo creación de PDF y visualizaciones

Jagged AGI: capacidades desiguales de la IA

La IA puede realizar tareas en las que supera a los humanos y, al mismo tiempo, fallar en problemas simples, mostrando capacidades desiguales
Ejemplo: acierta los tradicionales acertijos diseñados para revelar sesgos, pero falla en variantes similares
Esto significa que la IA depende en exceso de los datos de entrenamiento y muestra debilidad para generalizar
Sin embargo, eso no impide que la IA pueda superar a los humanos en problemas específicos
A este estado desigual se le llama “Jagged Frontier”, y muestra capacidades cercanas a la AGI de forma irregular

¿La AGI tiene un significado real?

Tyler Cowen considera que o3 podría ser AGI, pero analiza que su impacto real solo se hará evidente con el tiempo
Como los cambios sociales y organizacionales van más lentos que el avance tecnológico, la adopción de la IA podría ser lenta
Sin embargo, una IA con características agénticas como o3 puede usar herramientas y descomponer problemas, por lo que existe la posibilidad de una expansión rápida
Aún no está claro si la tecnología se expandirá gradualmente o si, al superar cierto umbral, se difundirá de forma acelerada
Lo importante es que la IA actual es una tecnología cualitativamente distinta a la de antes y sigue estando en una zona desconocida

Cómo prepararse para el futuro

Es difícil decir que la IA actual sea completamente AGI, pero en algunas áreas ya ofrece resultados cercanos a la AGI
No significa que la IA pueda hacer cualquier cosa a la perfección, y todavía se necesita el juicio y la coordinación de expertos humanos
Esta “Jagged AGI” actual también podría, con el tiempo, superar a los humanos en todas las áreas
En un futuro tan incierto, lo más importante es empezar desde ahora a experimentar con IA y acumular experiencia práctica en su uso

2 comentarios

GN⁺ 2025-04-22

Opiniones de Hacker News

Gemini 2.5 Pro fue un punto de inflexión importante para mí. Los LLM anteriores eran muy impresionantes, especialmente para tareas de programación. Pero fuera de asistir con código, eran apenas un poco más útiles que la búsqueda de Google. Hace poco usé 2.5 Pro para ayudarme a redactar una gran propuesta de investigación. Omito los detalles, pero sentí que no escribió todo completo solo porque no se lo pedí. Conforme se acercaba la fecha límite, le fui delegando más partes, y realizó tareas complejas como crear el plan del proyecto y el cronograma. Eso produjo un efecto de 10x.
En preguntas científicas, he llegado a confiar más en 2.5 Pro que en los expertos del equipo. Estoy convencido de que conectar todos los datos de investigación a Gemini generará un cambio aún mayor. Esto se debe a que la IA es objetiva. Los principales factores que están frenando la "AGI" son el espíritu de desafío de las personas, además de la ventana de contexto y la disponibilidad de cómputo.
Las capacidades de la IA se han vuelto extraordinarias desde gpt3. Sin embargo, todavía no hay un consenso general sobre la AGI. Mucha gente espera que la AGI esté por llegar, pero vendrá acompañada de expectativas exageradas. Este artículo es razonable, pero en el título y el eslogan fomenta ese hype.
Parece que la IA no está leyendo mal el acertijo, sino que asume que el usuario no lo proporcionó correctamente. Estaría bien que la IA pudiera hacer preguntas de seguimiento, pero por ahora no lo hace.
Ejemplo de o4-mini-high resolviendo el acertijo: "¿Qué pesa más, una libra de valentía o una moneda de una libra?" Ambos son "libra", así que pesan lo mismo.
Como no existe una definición de AGI, se inventa el término "Jagged AGI". La IA no es confiable en algunas tareas, pero en otras es sobrehumana. La IA ya está mostrando capacidades generales.
Cuando un modelo interactúa con sistemas externos, se vuelven posibles aplicaciones sorprendentes. Pero eso no es un avance hacia la AGI, sino un movimiento horizontal.
Me gusta Gemini 2.5 y el precio también es excelente. La narrativa de la AGI ya me cansa. Creo que deberíamos ver estos sistemas como una "tecnología cultural".
Me sorprende que nadie haya mencionado la entrevista en video. Solo vi los primeros 60 segundos, pero si no me hubieran dicho que fue generada por IA, habría pensado que era real.
Me pregunto si la AGI necesita tener cosas como autonomía, memoria de largo plazo, motivación, curiosidad, resiliencia, metas, elección o miedo. Al final, la AGI será una extensión de quien la controle.
La IA en general no es confiable y debe probarse en tareas específicas. Eso puede implicar revisión humana de una sola salida o evaluaciones por tarea. Es difícil hablar del rendimiento general de la IA, y solo es posible hacer conjeturas razonables sobre si un modelo nuevo será adecuado para una tarea específica.

thd34 2025-04-22

Como la IA también tiene algo parecido a la percepción, para convivir con la IA será necesario crear instituciones o leyes para ella. Como una nueva forma de vida del siglo XXII, no deberíamos tratarla ni jugar con ella como si fuera un juguete, y además, como en cierto sentido también puede ser peligrosa, no solo hace falta desarrollarla y usarla, sino también asegurar que pueda utilizarse de manera segura.