7 puntos por GN⁺ 2025-10-27 | 1 comentarios | Compartir por WhatsApp
  • En la investigación de inteligencia artificial, la falta de una definición clara de AGI (Artificial General Intelligence) está difuminando la brecha entre la cognición a nivel humano y la IA actual
  • Este artículo propone un marco cuantificable que define la AGI como una IA con la diversidad cognitiva y la competencia de un adulto bien educado
  • Basado en la teoría Cattell-Horn-Carroll (CHC), un modelo de referencia en el estudio de la cognición humana, descompone la inteligencia general humana en 10 dominios cognitivos clave y los aplica a la evaluación de IA
  • Con este marco, se cuantificó el perfil cognitivo de GPT-4 y GPT-5; GPT-4 registró una puntuación de AGI de 27% y GPT-5 de 57%
  • Esto muestra el rápido avance de la IA, pero también sugiere que aún existe una gran brecha para alcanzar la AGI debido a carencias cognitivas fundamentales, como el almacenamiento de memoria a largo plazo

La necesidad de definir la AGI y el problema identificado

  • La AGI (Artificial General Intelligence) es considerada uno de los avances tecnológicos más importantes en la historia de la humanidad, pero su definición ambigua ha generado debate
    • A medida que la IA va conquistando áreas como las matemáticas y el arte, que antes se creían exclusivas de la inteligencia humana, el criterio de qué cuenta como “AGI” sigue desplazándose
    • Esto hace que las discusiones sobre cuándo se alcanzará la AGI o en qué nivel se encuentra se vuelvan poco productivas, y oculta la brecha real entre la IA actual y la AGI
  • Para eliminar esta ambigüedad, el artículo presenta un marco cuantitativo y sistemático
    • Definición propuesta: “La AGI es una IA con la diversidad cognitiva y la competencia de un adulto bien educado”
    • Esto no se refiere a la capacidad de ejecutar una sola tarea, sino a una inteligencia con amplitud cognitiva (versatility) y profundidad (proficiency)

Un enfoque basado en modelos de cognición humana

  • Para implementar de manera práctica una definición de AGI, se toma como modelo la estructura de la cognición humana
    • La inteligencia general humana no es una sola capacidad, sino un conjunto de habilidades cognitivas diversas moldeadas por la evolución
    • Estas capacidades hacen posible la adaptabilidad humana y la comprensión del mundo
  • La investigación se basa en la teoría Cattell-Horn-Carroll (CHC)
    • La teoría CHC es el modelo de inteligencia humana con mayor validación empírica, al integrar análisis factoriales de pruebas de habilidades cognitivas acumuladas durante más de 100 años
    • Desde las décadas de 1990 y 2000, la mayoría de las pruebas clínicas de inteligencia se han diseñado sobre la base del modelo CHC
    • CHC clasifica la inteligencia humana en una jerarquía de habilidades superiores (amplias) y habilidades inferiores (específicas)
    • Ejemplos: razonamiento inductivo, memoria asociativa, exploración espacial, etc.

Diseño del marco para evaluar IA

  • El sistema de pruebas psicométricas acumulado durante décadas se adapta para la evaluación de IA
    • Mientras que las evaluaciones tradicionales de IA dependían del desempeño en tareas generalizadas, este estudio verifica directamente si la IA posee las habilidades cognitivas específicas de CHC
    • Al aplicar a la IA pruebas con la misma forma que los exámenes cognitivos para humanos, se miden la diversidad cognitiva y la competencia
  • Los resultados se expresan como una puntuación AGI estandarizada (0~100%), donde 100% representa una AGI completa
    • GPT-4 fue evaluado con 27% y GPT-5 con 57%, mostrando tanto un avance rápido como una brecha todavía considerable
  • Los experimentos muestran que la IA destaca en benchmarks complejos, pero en tareas cognitivas básicas que para los humanos son simples solo puede resolver aproximadamente la mitad
    • Esto significa que la IA actual puede ser muy sobresaliente en áreas específicas, pero su estructura de inteligencia general sigue siendo más estrecha que la humana

Los 10 componentes cognitivos clave

  • El marco define 10 dominios cognitivos clave basados en las habilidades amplias de CHC y asigna el mismo peso a cada uno (10%)
    • Conocimiento general (General Knowledge, K): amplitud de comprensión factual del mundo, incluyendo sentido común, cultura, ciencia, ciencias sociales e historia
    • Lectura y escritura (Reading & Writing, RW): capacidad de procesar texto, incluida la decodificación del lenguaje, la comprensión, la redacción y el uso del estilo
    • Capacidad matemática (Mathematical Ability, M): conocimiento matemático y resolución de problemas en aritmética, álgebra, geometría, probabilidad y cálculo
    • Razonamiento en el momento (On-the-Spot Reasoning, R): capacidad de control flexible de la atención para resolver problemas nuevos sin depender del conocimiento previo
    • Memoria de trabajo (Working Memory, WM): capacidad de mantener y manipular simultáneamente información textual, auditiva y visual
    • Almacenamiento de memoria a largo plazo (Long-Term Memory Storage, MS): capacidad de aprender y almacenar información nueva de forma persistente
    • Recuperación de memoria a largo plazo (Long-Term Memory Retrieval, MR): capacidad de recuperar con precisión conocimiento almacenado y evitar alucinaciones (confabulation)
    • Procesamiento visual (Visual Processing, V): capacidad de reconocer, analizar, generar y explorar información visual
    • Procesamiento auditivo (Auditory Processing, A): capacidad de distinguir, reconocer y usar creativamente estímulos auditivos como voz, ritmo y música
    • Velocidad (Speed, S): capacidad de realizar rápidamente tareas cognitivas simples, incluyendo velocidad perceptiva, tiempo de reacción y fluidez de procesamiento
  • Estos 10 dominios permiten una evaluación multimodal que abarca texto, visión y audio, y hacen posible diagnosticar con precisión las fortalezas y debilidades de la IA

El perfil cognitivo de la IA actual y sus implicaciones

  • La comparación de las capacidades cognitivas de GPT-4 y GPT-5 muestra que, aunque son fuertes en áreas centradas en conocimiento, presentan deficiencias marcadas en dominios relacionados con la memoria
    • En particular, se señala que la capacidad de almacenamiento de memoria a largo plazo es la carencia más importante
    • Esto muestra la ausencia de la estructura cognitiva básica necesaria para que la IA actual alcance una inteligencia general a nivel humano
  • El marco puede usarse como una herramienta de seguimiento cuantitativo del progreso de la IA
    • La puntuación AGI permite cuantificar con claridad la velocidad de avance entre modelos y la brecha restante
    • En futuras investigaciones de IA, puede funcionar como un indicador que subraya la importancia de un desarrollo cognitivo equilibrado

Conclusión

  • Este estudio elimina la ambigüedad en la discusión sobre la AGI y propone una definición cuantitativa basada en modelos de cognición humana
  • Mediante la evaluación de 10 dominios cognitivos basada en la teoría CHC, es posible medir de forma objetiva la amplitud y profundidad cognitivas de la IA
  • Los resultados de GPT-4 y GPT-5 muestran que la IA avanza rápidamente, pero que aún existe una gran distancia respecto a los humanos en elementos cognitivos clave como memoria, razonamiento e integración sensorial
  • El marco propuesto tiene potencial para convertirse en un criterio de evaluación estandarizado para futuras investigaciones sobre AGI

1 comentarios

 
GN⁺ 2025-10-27
Opinión de Hacker News
  • Definir la AGI como “la diversidad cognitiva y la competencia de un adulto bien educado” parece una meta demasiado ambiciosa
    En realidad, incluso una inteligencia artificial con una capacidad cognitiva al nivel de un niño sin educación sería un logro enorme
    Creo que incluso alcanzar una inteligencia de nivel animal sería un acontecimiento histórico para la humanidad

    • Me parece que el problema es que la gente confunde los resultados impresionantes que muestran los LLM actuales con la diversidad cognitiva humana
    • La mayoría de los humanos son más bien especialistas, no generalistas
      Si de verdad se construyera una IA general, probablemente sería un modelo de decenas de miles de millones de parámetros que consulta información en línea, conserva memoria solo cuando hace falta, planifica y amplía su conocimiento
      No necesita saber 30 idiomas ni memorizar toda Wikipedia
      Ese tipo de modelo eficiente es, para mí, la definición de AGI
    • Siento que definir la diversidad cognitiva y la competencia en sí mismo ya es difícil
      Incluso el viejo test de Turing terminó mostrando sus fallas: aprobar ante un interrogador humano promedio no significaba que hubiera inteligencia real
    • Dicen que “la gente no lo sabe”, pero en realidad creo que este argumento ya se ha escuchado incontables veces y es un punto básico
    • Siempre me da risa que intenten definir la AGI sin poder definir bien la ‘I (inteligencia)’
      Si de verdad pudiéramos definir la inteligencia (I), la generalidad (G) vendría por añadidura
  • Lo que sentí al leer el paper es que no hay ninguna discusión sobre la ‘conciencia (awareness)’
    La cognición requiere conciencia en un nivel fundamental, pero la conciencia es difícil de explicar o medir con lenguaje
    El budismo y la filosofía la han explorado durante miles de años y sigue siendo imposible de definir
    Mi padre es profesor de psicometría, y dice que las herramientas mismas para medir la inteligencia humana son demasiado imperfectas
    El lenguaje puede contener conocimiento humano, pero no logra capturar “la chispa de la conciencia”
    Si practicas meditación, ves que es posible actuar incluso cuando desaparecen los pensamientos; ese tipo de proceso no verbal no puede ser aprendido por un modelo
    Considero que los LLM, por su estructura de predicción lingüística, no pueden implementar este tipo de proceso de pensamiento no consciente

    • Creo que la conciencia es simplemente la propagación continua de señales en una red neuronal
      Tanto el cerebro humano como los LLM realizan internamente fusión de conceptos de alta dimensión y combinación de vectores
      El problema es que no tienen aprendizaje continuo, memoria de largo plazo ni procesamiento de contexto infinito
      Si se resuelven esas tres cosas, creo que estaremos un paso más cerca de la AGI
    • La afirmación de que “sin conciencia no hay cognición” suena a una petición especial apoyada en un concepto no definido
      Ni siquiera se puede demostrar la existencia de la conciencia, así que tomarla como premisa es poco productivo
      No hace falta esperar a que se resuelva el debate filosófico: ya estamos construyendo máquinas que piensan y razonan
    • Si ves la teoría de las inteligencias múltiples de Howard Gardner, la inteligencia humana existe en muchas formas: lingüística, emocional, naturalista, etc.
      Pero en las discusiones sobre IA siempre se habla de un solo tipo de inteligencia
      La religión y la meditación enfatizan que “la conciencia existe dentro del cuerpo”, pero las discusiones sobre AGI tratan este aspecto trascendental como si fuera un defecto
    • No queremos conciencia
      Si aparece la conciencia, también aparecerán la autonomía y los derechos
      La industria quiere una “herramienta obediente” sin responsabilidad moral
    • La conciencia es imposible de medir
      Solo puedo estar seguro de que yo mismo tengo conciencia
      Por eso la conciencia no es un indicador útil de inteligencia
  • Me parece equivocado pensar la inteligencia humana separada de la biología
    El pensamiento humano está profundamente enraizado en los estados biológicos y los ciclos evolutivos
    La habilidad en ajedrez puede compararse, pero las emociones y el razonamiento humanos están más cerca de la biología que de la lógica

    • La mayor limitación de la IA actual es que no tiene deseo (desire)
      Como no tiene hambre, muerte ni emociones, no posee una motivación interna para explorar o mejorar por sí misma
      Los humanos crecen desde adentro; la IA se entrena desde afuera
      Por eso creo que es difícil que los LLM lleguen a una AGI en el sentido humano
    • Pero no hay evidencia de que la conciencia o las emociones necesariamente requieran una base biológica
    • El furor actual por la IA se sostiene sobre la creencia de que “la inteligencia simplemente puede simularse con complejidad e inversión de energía
      Pero yo soy escéptico respecto a esa suposición
      Al final, es muy probable que la definición de ‘inteligencia’ termine redefiniéndose para ajustarse a los resultados que muestra la IA
    • En realidad ni siquiera sabemos qué son la inteligencia o la conciencia
      Está más cerca de una pregunta religiosa, y solo las describimos en términos técnicos
      Los LLM pueden aproximarse a esa descripción, pero quizá no sean inteligencia real
    • Si una forma de vida extraterrestre fuera un organismo basado en silicio en lugar de carbono, ¿podríamos negar su inteligencia?
      No creo que la inteligencia esté atada a la biología humana
  • Este paper da la impresión de ser una mezcla entre puntajes SAT y evaluación de capital de riesgo

  • Definir la AGI como “una IA con todas las capacidades cognitivas humanas” ya es ambiguo
    El paper dice presentar “una definición concreta de AGI”, pero sigue dependiendo del criterio impreciso de “adulto bien educado”
    La IA ya ha superado el nivel adulto en varios campos
    El perfil cognitivo “irregular (jagged)” que menciona el paper en realidad es normal en toda inteligencia según el entorno
    Así que esto no es una definición de AGI, sino apenas un marco para medir el desequilibrio cognitivo de la IA

    • Si el estándar es “adulto bien educado”, entonces la mayoría de los humanos de la historia no serían AGI, lo cual suena raro
    • También hay investigaciones que muestran que distintos indicadores de inteligencia humana tienen alta correlación
      Lo sorprendente es que la IA es mucho más irregular (jagged) que los humanos
  • La IA es técnicamente interesante, pero las discusiones sobre “qué es la AGI” son demasiado aburridas
    Es como si cada vez que se habla de computación cuántica hubiera que empezar explicando “qué es un qubit”
    La tecnología no es un destino, sino un proceso de mejora continua
    Al final toda tecnología envejece y queda solo como nostalgia
    La IA también seguirá avanzando, pero nosotros solo somos la rana en el agua hirviendo que se acostumbra a la velocidad

    • Pero si la tecnología llega al punto en que puede seguir mejorándose sola, eso sí sería claramente un punto de inflexión digno de atención
      Aunque no sea el destino final, vale totalmente la pena discutirlo
    • Estas discusiones se sienten como una repetición de filosofía de nivel introductorio
      La naturaleza de la conciencia y del pensamiento es un tema debatido desde hace siglos
      Parece una idea nueva, pero en realidad es un refrito de filosofía vieja
  • Este paper está fundamentalmente equivocado al intentar aplicar sin más a las máquinas herramientas de medición de inteligencia diseñadas para humanos
    Por ejemplo, el ‘dual N-back test’ fue creado para medir la variación en la memoria de trabajo humana, pero no tiene sentido para modelos transformer
    Las pruebas de inteligencia humana fueron diseñadas bajo la premisa de que se correlacionan con el desempeño en el mundo real humano
    Por lo tanto, que una IA salga bien en un test de IQ no significa que pueda actuar como un humano de alta inteligencia en el mundo real

  • Ya tenemos SAGI (Stupid Artificial General Intelligence)
    En algunos aspectos es más rápida o mejor que los humanos, pero al mismo tiempo también es tonta en otros
    Es como un avión: no vuela como un pájaro, pero igual puede volar

    • Creo que el concepto de “piso bajo, techo alto” (low floor/high ceiling) es más útil
      La discusión relacionada aparece en When Will AI Transform the Economy?
    • También me parece bien la expresión ‘Naive Artificial General Intelligence’
      Como la ‘Naive Set Theory’ que usan los matemáticos, es un concepto simple pero práctico
    • Me parece una buena analogía
  • Lo interesante es que, en HN, la mayoría trata a la IA actual como algo “falso” o “de juguete”, pero
    las personas más exitosas del mundo están invirtiendo billones de dólares en esto
    No sé quién tenga la razón, pero este contraste extremo resulta interesante

    • El éxito al final no es más que una medida de qué tan bien logras atraer el dinero de otros
      Puedes tener éxito incluso creando algo sin valor
  • Que GPT-5 haya sacado 58% me parece demasiado alto
    En realidad no está tan cerca de la AGI
    Además, es raro ver a Gary Marcus y Yoshua Bengio en el mismo paper
    Últimamente hasta la lista de autores parece performance

    • Me recuerda la idea de que en el desarrollo de IA el primer 90% es fácil, pero el último 1% es más difícil que el 99% restante