- El problema de Erdős #728 fue resuelto recientemente de forma casi autónoma por herramientas de IA, marcando un nuevo hito en la automatización de la investigación matemática
- El problema era originalmente una pregunta sobre la factorización prima de coeficientes binomiales planteada en 1975 por Erdős, Graham, Ruzsa y Strauss, y durante mucho tiempo no pudo abordarse con claridad debido a condiciones ambiguas
- ChatGPT generó una prueba bajo restricciones ajustadas, y Aristotle la formalizó como una prueba formal en Lean, corrigiendo errores automáticamente
- Después, varios participantes la reescribieron en lenguaje natural con ChatGPT y mejoraron iterativamente una versión con mejores conexiones con la literatura y una estructura narrativa más sólida
- Terence Tao evaluó que este proceso muestra el potencial de la rápida capacidad de la IA para redactar y corregir pruebas para cambiar la forma misma en que se escriben los artículos de investigación
El problema de Erdős #728 resuelto por IA
- La aplicación reciente de herramientas de IA a la resolución de problemas de Erdős mostró un nuevo avance, y el problema #728 fue resuelto por IA de forma casi autónoma
- Tras intentos iniciales, se logró el éxito en una versión corregida que incorporó retroalimentación
- El resultado no pudo reproducirse de forma idéntica en la literatura existente, aunque sí había resultados parecidos con métodos similares
- Este caso muestra que en los últimos meses la capacidad de la IA para resolver problemas matemáticos realmente ha mejorado
- En el pasado también hubo casos en los que la IA resolvió problemas de Erdős, pero la mayoría después resultó corresponder a soluciones que ya existían en la literatura
- En este caso, el enunciado original de Erdős había sido presentado de forma incorrecta y solo recientemente fue reconstruido en la forma pretendida
- Esto explicaría por qué había poca investigación relacionada en la literatura previa
Historia del problema y enfoque inicial
- En 1975, Erdős, Graham, Ruzsa y Strauss estudiaron la factorización prima del coeficiente binomial (2n choose n) y plantearon varios problemas relacionados
- Uno de ellos preguntaba si existen infinitos valores de a, b y n que satisfagan la condición a!b! | n!(a+b−n)! y a+b > n + C log n
- Sin embargo, varias partes estaban descritas de forma ambigua, incluido el tamaño de C (si era pequeño o grande)
- Hace unos meses, el equipo de AlphaProof encontró una solución simple al problema, pero no coincidía con el espíritu del problema previsto, por lo que se añadió la restricción a,b ≤ (1−ε)n
- Incluso después, una búsqueda bibliográfica asistida por IA apenas encontró trabajos relacionados
Colaboración entre ChatGPT y Aristotle
- El 4 de enero, ChatGPT generó una prueba para el caso de C pequeño bajo las restricciones ajustadas
- Esa prueba fue formalizada por Aristotle como una prueba formal en Lean
- Más tarde, al revisar el texto original, se confirmó que el artículo original ya trataba el caso de C pequeño
- Otro participante convirtió la prueba en Lean a lenguaje natural con ChatGPT y, mediante conversaciones adicionales, redactó una versión mejorada
- Esa versión llenó algunos huecos de la demostración, pero aún conservaba un estilo torpe característico de la IA y falta de citas bibliográficas
- Aun así, alcanzó un nivel lo bastante legible como para comprender la idea central
Reescritura a gran escala y resultado mejorado
- Con prompts adicionales, ChatGPT generó una prueba ampliada al caso de C grande
- Hubo algunos errores, pero Aristotle los corrigió automáticamente y completó una prueba verificada en Lean
- Después de que un tercer participante comprimiera la prueba en Lean, otro participante, mediante una larga conversación con ChatGPT, la reescribió en una forma más acabada
- Fortaleciendo las conexiones con la literatura y la estructura narrativa en formato de artículo
- El resultado fue evaluado como de menor apariencia de texto generado por IA y con una calidad cercana a la de un artículo de investigación
- Tao mencionó que revisó este texto en el foro de problemas de Erdős
Cómo la IA está cambiando la forma de escribir artículos de investigación
- Tao considera que en el artículo final las partes clave todavía deben ser escritas por humanos, pero
- evalúa que la combinación de IA y Lean elevó de forma drástica la velocidad de redacción y corrección de pruebas
- Antes, hacer que un artículo resultara agradable de leer requería mucho tiempo, y
- incluso las revisiones en respuesta a comentarios de revisión solían limitarse a cambios locales
- Pero ahora, la combinación de la capacidad de la IA para generar y corregir texto y la verificación de las herramientas de prueba formal permite
- generar rápidamente nuevas versiones de un artículo con distintos niveles de precisión y narración
- Además de un único “artículo oficial”, podrían existir múltiples versiones auxiliares generadas por IA,
- lo que abre la posibilidad de aportar diversas perspectivas y valor adicional
Reacción de la comunidad
- Algunos usuarios describieron el valor adicional de los documentos generados por IA como la capacidad de ver las cosas desde otros ángulos
- Otros matemáticos plantearon la necesidad de medir la originalidad de los resultados de IA o evaluar su similitud con la literatura existente
- Por ejemplo, se propuso una medición cuantitativa de similitud mediante la comparación de la longitud de pruebas formales en Lean
- Otro comentario señaló que, así como en el refactoring de código, la IA puede reescribir un artículo de forma global,
- por lo que los investigadores deberían concentrarse más en diseñar la estructura documental de más alto nivel
- Algunos mostraron escepticismo ante la posibilidad de que la IA sustituya el papel del matemático, pero
- otros lo valoraron como una nueva oportunidad para la colaboración y la expansión del pensamiento
1 comentarios
Opiniones de Hacker News
Trabajo en Harmonic y quiero aclarar algunos malentendidos sobre Aristotle que hemos visto
Aristotle aprovecha activamente las técnicas más recientes de IA, incluyendo modelado del lenguaje
Si ingresas una demostración informal en inglés, hay una alta probabilidad de que se traduzca a Lean si la demostración es correcta. Es decir, eso se vuelve una señal fuerte de que la demostración en inglés está bien fundamentada
Una vez que queda formalizada en Lean, ya no hay dudas de que la demostración es correcta. Ese es nuestro enfoque central: si encontramos una respuesta mediante exploración impulsada por IA, podemos garantizar la exactitud del resultado sin importar su complejidad
Rust usa un conjunto fijo de reglas para garantizar seguridad de memoria, pero esas reglas son simples y limitadas. Si un sistema como Aristotle pudiera integrarse al compilador y permitir que el código pase automáticamente cuando sea posible demostrar su corrección, sería realmente genial
Me pregunto cuánto falta para que Harmonic pueda formalizar la mayor parte de las matemáticas escritas por humanos. Un competidor, Christian Szegedy, decía que sería posible dentro de este año
Por la explicación de Terence Tao, parece que un humano fue pasando resultados entre dos herramientas de IA, y que la IA cumplió el rol de rellenar los huecos que el humano había encontrado
Se parece más a una colaboración entre humanos e IA que a una resolución completamente autónoma. O sea, expertos guiando y la IA asistiendo
Reconstituir demostraciones existentes o combinarlas de nuevas maneras es un proceso tedioso o complejo para los humanos, pero la IA puede hacerlo a velocidad sobrehumana
Este enfoque podría abrir posibilidades enormes incluso antes de llegar a AGI. Parece posible que llegue una era en la que los matemáticos usen IA como herramienta para abordar problemas difíciles como los Millennium Prize Problems
El valor real de los LLM está en proponer nuevas perspectivas en temas que pueden expresarse con lenguaje
En la explicación escrita por la persona que realmente resolvió el problema, impresiona que el resultado se obtuvo sin un pipeline enorme y con solo unos pocos prompts
Los modelos recientes usan muchos más recursos de cómputo, así que esto más bien parece un resultado de línea base
Terence Tao creó una página wiki llamada “AI contributions to Erdős problems”
Según la página de GitHub y esta publicación en Mathstodon, este resultado (problema 728) es el primer ‘ítem verde’ de esa página, es decir, el primer caso realmente resuelto por IA
Me pregunto si especialistas en campos complejos como física o matemáticas también conversan con IA para recibir ayuda
Viéndolo por áreas, su utilidad baja en este orden: programación > ML aplicado > estadística/matemática aplicada > matemática pura
Ya puedes probar Aristotle directamente — https://aristotle.harmonic.fun/
Además, el enlace a la página personal de Stanford está mal (hay que quitar
www)Este resultado es un teorema sobre enteros, un área donde la infraestructura de Mathlib da muy buen soporte
Las definiciones usadas tampoco son complejas, así que este tipo de demostraciones tiene alta probabilidad de éxito. Aun así, es un logro realmente impresionante
Es un caso que muestra el potencial de enfoques de IA especializados más allá de los LLM
El paper de Aristotle está en arXiv:2510.01346
Que use arquitectura Transformer no significa automáticamente que sea un LLM — no se le puede llamar LLM si no fue entrenado con datos de lenguaje
O sea, todas las etapas están basadas en LLM
En 2026 parece probable que la IA empiece a abordar cada vez más problemas abiertos de matemáticas
Este caso tampoco fue completamente autónomo, pero aun así la IA prácticamente lo resolvió sola después de recibir feedback humano
Creo que ya se acabó la discusión de que “los LLM son solo loros estocásticos”. De ahora en adelante, la discusión real será cómo llevar esto a aplicaciones prácticas