HyperAgents: el framework de agentes auto-mejorables de Meta AI

(ai.meta.com)

6 puntos por GN⁺ 19 일 전 | Aún no hay comentarios. | Compartir por WhatsApp

Un sistema de agentes de IA autorreferencial que mejora por sí mismo su propio aprendizaje y proceso de resolución de problemas para reducir la dependencia de la ingeniería humana, superando las limitaciones de los mecanismos meta fijos de los enfoques existentes de auto-mejora recursiva
Una arquitectura que integra al agente de tareas (ejecuta la tarea objetivo) y al metaagente (se modifica a sí mismo y al agente de tareas) en un solo programa editable
Mientras que el Darwin Gödel Machine (DGM) existente solo podía auto-mejorarse en el dominio de la programación, HyperAgents se expande a diversos dominios como programación, revisión de artículos, robótica y calificación de matemáticas
El procedimiento de modificación a nivel meta también es editable, y su diferenciador clave es la automodificación metacognitiva que mejora el propio mecanismo de mejora
Se confirmó experimentalmente que las mejoras a nivel meta se transfieren entre dominios y se acumulan entre ejecuciones, mostrando el potencial de un sistema de IA general de autoaceleración

Limitaciones de los sistemas existentes de auto-mejora

Los sistemas de IA con auto-mejora buscan mejorar automáticamente el propio proceso de aprendizaje y resolución de problemas para reducir la dependencia de la ingeniería humana
Los enfoques existentes de auto-mejora recursiva dependen de mecanismos de nivel meta fijos y hechos manualmente, por lo que existe un límite fundamental en la velocidad a la que el sistema puede mejorar

DGM (Zhang et al., 2025b) es un sistema que demostró que la auto-mejora abierta es posible en el dominio de la programación
Parte de un único agente de programación y genera y evalúa repetidamente variantes auto-modificadas, mientras expande un archivo de peldaños para mejoras futuras
Como tanto la evaluación como la automodificación son tareas de programación, mejorar la capacidad de programar conduce directamente a mejorar la capacidad de auto-mejora
Sin embargo, esta alineación específica del dominio (domain-specific alignment) tiene la limitación de que, por lo general, no se sostiene fuera del ámbito de la programación

HyperAgents es un agente autorreferencial (self-referential agent) que integra dos componentes en un único programa editable
- Agente de tareas (task agent): cumple la función de resolver la tarea objetivo
- Metaagente (meta agent): cumple la función de modificarse a sí mismo y al agente de tareas
De forma clave, el propio procedimiento de modificación a nivel meta es editable, implementando la automodificación metacognitiva (metacognitive self-modification)
- Hace posible mejorar no solo el comportamiento de resolución de tareas, sino también el propio mecanismo que genera mejoras futuras

Se concreta como DGM-Hyperagents (DGM-H) al extender DGM
Al permitir que el propio procedimiento de mejora evolucione, elimina la suposición de alineación especializada por dominio entre el rendimiento en tareas y la capacidad de automodificación
En teoría, abre la posibilidad de respaldar un progreso autoacelerado en cualquier tarea computable

Se realizaron experimentos en diversos dominios, incluidos programación, revisión de artículos, diseño de recompensas en robótica y evaluación de soluciones matemáticas a nivel de olimpíada
DGM-H mejora su desempeño de forma continua con el tiempo
Logró mejor rendimiento que las líneas base sin auto-mejora ni exploración abierta, y también que el DGM existente

Se confirmó que DGM-H mejora el propio proceso que genera nuevos agentes
- Ejemplo: derivó mejoras a nivel meta como memoria persistente (persistent memory) y seguimiento de rendimiento (performance tracking)
Estas mejoras a nivel meta tienen la característica de poder transferirse entre dominios (transfer across domains) y acumularse entre ejecuciones (accumulate across runs)

Todos los experimentos se realizaron con medidas preventivas de seguridad como sandboxing y supervisión humana
Incluye una discusión sobre el significado de la seguridad en el contexto de los sistemas de auto-mejora y sobre las implicaciones amplias de los sistemas de auto-mejora

DGM-Hyperagents plantea la posibilidad de sistemas de IA abiertos que no solo buscan mejores soluciones, sino que mejoran continuamente la propia forma de mejorar