La IA de DeepMind resuelve problemas de la Olimpiada Internacional de Matemáticas a nivel de medalla de plata
(deepmind.google)- AlphaProof y AlphaGeometry 2 de Google DeepMind resolvieron problemas de la Olimpiada Internacional de Matemáticas
- AlphaProof: sistema de razonamiento matemático basado en aprendizaje por refuerzo
- AlphaGeometry 2: sistema mejorado para resolver problemas de geometría
- Ambos sistemas resolvieron 4 de los 6 problemas de la Olimpiada Internacional de Matemáticas (IMO) de este año, logrando un desempeño de nivel medalla de plata
Logros de la IA en la resolución de problemas matemáticos complejos
-
Introducción a la IMO
- La competencia juvenil de matemáticas más antigua y prestigiosa, celebrada cada año desde 1959
- Los problemas del concurso abarcan álgebra, combinatoria, geometría y teoría de números
- Muchos ganadores de la Medalla Fields participaron antes en la IMO
-
El reto de la IMO para los sistemas de IA
- AlphaProof y AlphaGeometry 2 resolvieron los problemas de la IMO de este año
- Los problemas se calificaron según las reglas oficiales del concurso
- AlphaProof resolvió 2 problemas de álgebra y 1 de teoría de números
- AlphaGeometry 2 resolvió 1 problema de geometría
- No lograron resolver los 2 problemas de combinatoria
- Obtuvieron 28 puntos de un total de 42, alcanzando un desempeño de nivel medalla de plata
AlphaProof: un enfoque de razonamiento formal
-
Cómo funciona AlphaProof
- Demuestra proposiciones matemáticas en el lenguaje formal Lean
- Combina un modelo de lenguaje preentrenado con el algoritmo de aprendizaje por refuerzo AlphaZero
- Traduce problemas en lenguaje natural a proposiciones formales para resolver problemas de distinta dificultad
- Cuando se le presenta un problema, AlphaProof genera candidatos de solución y los prueba o refuta
- Los resultados demostrados refuerzan el modelo de lenguaje de AlphaProof, mejorando su capacidad para resolver problemas más difíciles
-
Proceso de entrenamiento
- Fue entrenado demostrando o refutando millones de problemas
- Incluso durante el período del concurso se aplicó el ciclo de entrenamiento para demostrar variaciones de los problemas
AlphaGeometry 2, aún más competitivo
-
Mejoras de AlphaGeometry 2
- Un modelo de lenguaje basado en Gemini y un sistema híbrido neuro-simbólico
- Entrenado con 10 veces más datos sintéticos que la versión anterior
- Mejoras en velocidad y precisión para resolver problemas de geometría
- Usa un mecanismo de intercambio de conocimiento al resolver nuevos problemas
-
Resultados en la IMO 2024
- Resolución del 83% de los problemas de geometría de la IMO de los últimos 25 años
- En la competencia de este año resolvió el problema 4 en 19 segundos
Una nueva frontera del razonamiento matemático
-
Experimentos con sistemas de razonamiento en lenguaje natural
- Experimentos con un sistema de razonamiento en lenguaje natural basado en Gemini
- Puede resolver problemas sin traducirlos a un lenguaje formal
- Se explora la posibilidad de combinarlo con otros sistemas de IA
-
Perspectivas futuras
- Los matemáticos podrían colaborar con herramientas de IA para explorar nuevas hipótesis, probar enfoques de resolución y acortar procesos de demostración
- Sistemas de IA como Gemini pueden mejorar las capacidades matemáticas y de razonamiento general
Resumen de GN⁺
- AlphaProof y AlphaGeometry 2 muestran el potencial de la IA en el razonamiento matemático
- Al alcanzar un desempeño de nivel medalla de plata en la Olimpiada Internacional de Matemáticas, demuestran la capacidad de la IA para resolver problemas matemáticos
- Abren la posibilidad de que los matemáticos colaboren con la IA para explorar nuevos enfoques de resolución de problemas
- Un proyecto con funciones similares son los modelos de procesamiento de lenguaje natural como GPT-3 de OpenAI
3 comentarios
Cuantas más personas matemáticas contribuyan al desarrollo de bibliotecas de matemática formal, más fácil será crear una IA matemática de alto rendimiento. Hasta donde yo sé, actualmente hay 3 personas coreanas que están trasladando a Mathlib, la biblioteca matemática de Lean, teorías matemáticas que ellas mismas formalizaron directamente en el lenguaje del asistente de pruebas Lean.
El año pasado participé un poco en el trabajo de migrar Mathlib de Lean 3 a Lean 4, y este año demostré uno de los teoremas no resueltos de la biblioteca Batteries de Lean 4.
Opiniones de Hacker News
Primera opinión
Segunda opinión
Tercera opinión
Cuarta opinión
Quinta opinión
Sexta opinión
Séptima opinión
Octava opinión
Novena opinión
Décima opinión
Esa mejor discusión puede verse aquí. https://leanprover.zulipchat.com/#narrow/stream/219941-Machine-Learnin…