Avances en la colaboración entre humanos, IA y asistentes de prueba en el problema ‘Claude Cycles’ de Knuth

(twitter.com/BoWang87)

2 puntos por GN⁺ 2026-03-30 | 1 comentarios | Compartir por WhatsApp

La parte no resuelta del problema de descomposición hamiltoniana planteado por Donald Knuth se amplió y resolvió mediante la colaboración entre humanos e IA
Claude encontró una solución para los valores impares de m, que fue bautizada como “Claude’s Cycles”; posteriormente, 996 de 11,502 ciclos se generalizaron a todos los m impares
Dr. Ho Boon Suan realizó con GPT-5.4 Pro una prueba de 14 páginas para m par ≥ 8 y una verificación computacional hasta m = 2000
Dr. Keston Aquino-Michaels descubrió un método de construcción simple para m impar y par mediante un flujo de trabajo multiagente con GPT y Claude
Dr. Kim Morrison verificó formalmente la solución de Knuth con el asistente de prueba Lean, completando un ecosistema de colaboración entre humanos, IA y herramientas de prueba

Colaboración ampliada para resolver el problema de Claude’s Cycles

La parte no resuelta del problema de descomposición hamiltoniana planteado por Donald Knuth fue resuelta mediante la colaboración entre humanos e IA
- Al inicio, Claude encontró en aproximadamente una hora de exploración una solución para m impar, y Knuth la bautizó como “Claude’s Cycles”
En el artículo actualizado, para el caso base m = 3 existen exactamente 11,502 ciclos hamiltonianos, y 996 de ellos se generalizan a todos los m impares
- Knuth confirmó entre ellos 760 descomposiciones válidas de tipo “Claude”
En el caso de m par, Claude no logró completarlo, pero Dr. Ho Boon Suan utilizó GPT-5.4 Pro para redactar una prueba de 14 páginas para m ≥ 8 y realizó una verificación computacional hasta m = 2000
Después, Dr. Keston Aquino-Michaels descubrió un método de construcción simple aplicable tanto a m impar como a m par mediante un flujo de trabajo multiagente que usa GPT y Claude en conjunto
Dr. Kim Morrison formalizó y verificó la solución impar de Knuth en el asistente de prueba Lean
- Como resultado, se formó un ecosistema completo de colaboración matemática en el que cooperan en paralelo humanos, varios sistemas de IA y herramientas de prueba formal
Esta serie de avances comenzó con la resolución de un solo problema por una IA y se expandió hacia un nuevo modelo de investigación matemática basado en la colaboración entre múltiples IA, humanos y asistentes de prueba
El artículo más reciente está disponible en el sitio web de Stanford CS Faculty(www-cs-faculty.stanford.edu/~knuth/papers/)

1 comentarios

GN⁺ 2026-03-30

Comentarios en Hacker News

Siempre he dicho que la IA ganará una Medalla Fields antes de operar un McDonald's
Las matemáticas se sienten difíciles para los humanos, como intentar girar un tornillo con un martillo
Los LLM son buenos para la exploración superficial pero amplia, así que están descubriendo muchos patrones matemáticos nuevos
Predigo que en el futuro habrá una transición desde los LLM hacia un aprendizaje por refuerzo estilo AlphaGo basado en árboles sintácticos de Lean
Si pudiéramos codificar los “10 trucos” que usan los matemáticos como vectores latentes, se acabó el juego
- Al final, los trucos no son más que patrones de fórmulas lógicas
  Pensamos aplicando analogías geométricas, como cuando usamos geometría algebraica en problemas de teoría de números
  Una IA entrenada con árboles de Lean podría incluso tener un sistema de intuición más amplio que el humano
  Como mostró StockFish en ajedrez, valdría la pena estudiar este enfoque desde la perspectiva de la interpretabilidad mecanicista (mechanistic interpretability)
- Soy matemático profesional, y en una buena demostración lo clave es la forma de representar el problema
  Sacar y usar trucos es algo que los LLM ya hacen bien
  Pero la parte de representar el problema correctamente sigue siendo tarea humana, y eso es natural
- Si un sistema llegara a entrenarse para descubrir nuevos trucos por sí mismo, sería realmente asombroso
- Me encanta demasiado la frase “la IA ganará una Medalla Fields antes de operar un McDonald's”
  Yo quisiera agregar mi propia versión: “el último trabajo en automatizarse será QA”
  Esta ola tecnológica nos ha hecho repensar la naturaleza del trabajo intelectual, y gracias a eso vamos a volvernos más agudos
- Yo también estoy intentando poco a poco implementar directamente un prototipo del enfoque de aprendizaje por refuerzo basado en árboles de Lean
Desde que aprendí el viejo dicho de 4chan “trolls trolling trolls”, siempre miro con sospecha las interacciones en internet
Ya sentía que Reddit se había convertido en un “internet muerto”, pero al ver este hilo ahora ya no puedo distinguir quién es bot y quién es humano
- Creo que esa observación es realmente importante
  Por eso hice un servicio llamado RememberBuddy — un espacio para guardar ideas del día a día y no olvidarlas
La evolución de la IA matemática parece que seguirá la trayectoria que Greg Egan anticipó en sus novelas en los años 90
La naturaleza de las matemáticas no cambiará, pero sí cambiará el “por qué” se hacen
En 『Diaspora』 de Egan, el descubrimiento matemático se describe como extraer joyas de una mina de sal
Algunas personas buscarán la belleza pura de esas joyas, y otras su valor práctico
Lugares como el instituto que ha fundado Terence Tao ya conectan con ese futuro
A corto plazo, esta clase de investigación va a mejorar mucho la capacidad de los sistemas de IA para generar información precisa
Algunas personas creen que descubrir conocimiento es simplemente imitar comportamientos pasados, pero yo no lo veo así
Si un experto guía bien al modelo, se puede resolver la mayoría de los problemas
El modelo es excelente como herramienta para hacer el trabajo perezoso del experto, pero en problemas complejos todavía existen puntos ciegos
Vi parte del prompt del sistema en el paper,
y había una regla que decía: “actualiza plan.md inmediatamente después de ejecutar cualquier exploreXX.py”
Me da curiosidad por qué este tipo de prompts mejora el rendimiento en resolución avanzada de problemas
- Probablemente es un mecanismo para facilitar reiniciar sin perder el proceso
Nos estamos acercando cada vez más a la visión del CEO de OpenAI de “inteligencia por suscripción (intelligence as a subscription)”
Se está subestimando lo importante que es reducir el cambio de pestañas
La mitad de las herramientas de IA no es una batalla de UX, sino una lucha por asegurar estabilidad en el acceso al modelo
“Si le das a 100 monos 100 armas y materiales de construcción, ¿construirán una casa o asaltarán un banco?”
Si ese resultado ocurriera, me gustaría preguntar si eso sería una conducta intencional
Vi este tuit
- La mayoría de los comentarios parecían claramente patrones de frases generadas por IA — repeticiones del tipo “eso no es X, es Y”

Avances en la colaboración entre humanos, IA y asistentes de prueba en el problema ‘Claude Cycles’ de Knuth

Colaboración ampliada para resolver el problema de Claude’s Cycles

Lecturas relacionadas

1 comentarios

Comentarios en Hacker News