1 puntos por GN⁺ 2024-01-18 | 1 comentarios | Compartir por WhatsApp

AlphaGeometry: un sistema de IA de geometría a nivel de olimpiada

  • AlphaGeometry es un sistema de IA que supera los enfoques de vanguardia para resolver problemas de geometría, y demuestra el avance de la IA en el campo del razonamiento matemático.
  • La Olimpiada Internacional de Matemáticas se ha convertido en un escenario para poner a prueba las capacidades matemáticas y de razonamiento de los sistemas de IA, donde compiten los mejores estudiantes de matemáticas de nivel medio superior del mundo.
  • AlphaGeometry es un sistema de IA capaz de resolver problemas complejos de geometría a un nivel cercano al de un medallista de oro humano de la olimpiada, y resolvió 25 de 30 problemas de geometría de olimpiada dentro del tiempo estándar.
  • El sistema de vanguardia anterior resolvió 10 problemas, y un medallista de oro humano promedio resuelve 25.9 problemas.
  • AlphaGeometry combina la capacidad predictiva de un modelo de lenguaje neuronal con un motor de razonamiento basado en reglas para realizar el razonamiento necesario para resolver problemas.
  • Se desarrolló un método para generar 100 millones de ejemplos únicos, lo que permite entrenar a AlphaGeometry sin demostraciones humanas.

El enfoque neuro-simbólico de AlphaGeometry

  • AlphaGeometry es un sistema neuro-simbólico compuesto por un modelo de lenguaje neuronal y un motor de razonamiento simbólico, que colaboran para encontrar demostraciones de teoremas geométricos complejos.
  • El modelo de lenguaje predice rápidamente patrones generales y relaciones en los datos, pero carece de la capacidad de razonamiento riguroso o de explicar sus decisiones.
  • El motor de razonamiento simbólico se basa en lógica formal y usa reglas claras para llegar a conclusiones; es racional y explicable, pero por sí solo resulta “lento” y poco flexible al abordar problemas grandes y complejos.
  • El modelo de lenguaje de AlphaGeometry predice nuevos elementos de construcción útiles para resolver problemas de geometría, guiando al motor simbólico para acercarse a la solución.

Generación de 100 millones de ejemplos de datos sintéticos

  • La geometría se basa en la comprensión del espacio, la distancia, la forma y la posición relativa, y es importante en muchos campos como el arte, la arquitectura y la ingeniería.
  • AlphaGeometry usa un enfoque de generación de datos sintéticos para poder entrenarse desde cero imitando el proceso de construcción de conocimiento a gran escala.
  • El sistema genera mil millones de diagramas geométricos aleatorios y, a partir de cada diagrama, deriva exhaustivamente todas las relaciones entre puntos y líneas.
  • Este enorme conjunto de datos, tras excluir ejemplos similares, produce finalmente un dataset de entrenamiento compuesto por 100 millones de ejemplos únicos.

Liderando el razonamiento matemático con IA

  • Todas las soluciones a problemas de olimpiada proporcionadas por AlphaGeometry fueron revisadas y verificadas por computadora.
  • Se comparan los resultados con métodos previos de IA y con el desempeño humano en las olimpiadas.
  • Aunque AlphaGeometry solo puede aplicarse a problemas de geometría de olimpiada, es por sí mismo el primer modelo de IA del mundo en superar el umbral de medalla de bronce de la IMO.
  • Este sistema se basa en el trabajo pionero de Google DeepMind y Google Research en razonamiento matemático con IA, y se aplica en diversos campos, desde la exploración de la belleza de las matemáticas puras hasta la resolución de problemas de matemáticas y ciencia con modelos de lenguaje.

GN⁺ opina:

  • El logro de AlphaGeometry es importante porque abre una nueva frontera en la aplicación de la IA a la resolución de problemas de geometría.
  • Este sistema demuestra la capacidad de la IA para resolver problemas matemáticos complejos, una habilidad esencial para el desarrollo futuro de sistemas de IA general.
  • Se espera que, con la publicación de AlphaGeometry como código abierto, se amplíen enormemente las posibilidades de uso de la IA en la investigación matemática y científica.

1 comentarios

 
GN⁺ 2024-01-18
Comentarios de Hacker News
  • Resumen de comentarios de Hacker News:
    • Esta investigación parece un trabajo mucho más práctico que los artículos previos de DeepMind sobre matemáticas con IA. La IA aprende teoremas de geometría y se usa para encontrar demostraciones, intentando pruebas al agregar estructuras geométricas aleatorias.
    • Puede que a este modelo le cueste generalizar, pero el enfoque neuro-simbólico es muy prometedor. Conecta el sistema 1 (herramientas de ML) con el sistema 2 (generación lógica de pruebas), lo que permite aprendizaje autosupervisado.
    • Hay curiosidad sobre qué tan seguido el modelo de lenguaje genera construcciones útiles. El artículo propone varias construcciones auxiliares alternativas y las procesa en paralelo para acelerar el trabajo.
    • Agradecimiento a los autores por haber publicado el código y los pesos. Esto sienta una base para que otros investigadores continúen el trabajo.
    • Resulta interesante que el modelo Transformer usado sea pequeño. El artículo describe las especificaciones concretas del Transformer.
    • Una cita de Evan Chen confirma que la demostración generada por la IA tiene una forma legible para humanos. Evan Chen es un miembro conocido de la comunidad de matemáticas de olimpiadas.
    • Sorprende que la técnica anterior más avanzada pudiera resolver 10 de estos problemas. Existen algoritmos prácticos para resolver problemas de geometría plana.
    • Aunque ChatGPT no pudo resolver problemas estilo IMO, si esta investigación es real, representa un gran avance. Encontrar demostraciones geométricas es una expresión de inteligencia y parece acercarnos más a la AGI.
    • Hay preguntas sobre el sistema deductivo usado para verificar las demostraciones. Las convenciones de la geometría de olimpiadas difieren de otras áreas de las matemáticas, y no está claro cómo formalizar esa lógica sin contradicciones.

Este resumen se basa en comentarios de Hacker News y organiza de forma concisa los puntos principales de cada comentario. Incluye el avance de la investigación sobre IA y demostraciones geométricas, las características del modelo y el debate sobre qué tan cerca está este tipo de investigación de la inteligencia artificial general (AGI).