2 puntos por GN⁺ 2026-03-30 | 1 comentarios | Compartir por WhatsApp
  • La parte no resuelta del problema de descomposición hamiltoniana planteado por Donald Knuth se amplió y resolvió mediante la colaboración entre humanos e IA
  • Claude encontró una solución para los valores impares de m, que fue bautizada como “Claude’s Cycles”; posteriormente, 996 de 11,502 ciclos se generalizaron a todos los m impares
  • Dr. Ho Boon Suan realizó con GPT-5.4 Pro una prueba de 14 páginas para m par ≥ 8 y una verificación computacional hasta m = 2000
  • Dr. Keston Aquino-Michaels descubrió un método de construcción simple para m impar y par mediante un flujo de trabajo multiagente con GPT y Claude
  • Dr. Kim Morrison verificó formalmente la solución de Knuth con el asistente de prueba Lean, completando un ecosistema de colaboración entre humanos, IA y herramientas de prueba

Colaboración ampliada para resolver el problema de Claude’s Cycles

  • La parte no resuelta del problema de descomposición hamiltoniana planteado por Donald Knuth fue resuelta mediante la colaboración entre humanos e IA
    • Al inicio, Claude encontró en aproximadamente una hora de exploración una solución para m impar, y Knuth la bautizó como “Claude’s Cycles”
  • En el artículo actualizado, para el caso base m = 3 existen exactamente 11,502 ciclos hamiltonianos, y 996 de ellos se generalizan a todos los m impares
    • Knuth confirmó entre ellos 760 descomposiciones válidas de tipo “Claude”
  • En el caso de m par, Claude no logró completarlo, pero Dr. Ho Boon Suan utilizó GPT-5.4 Pro para redactar una prueba de 14 páginas para m ≥ 8 y realizó una verificación computacional hasta m = 2000
  • Después, Dr. Keston Aquino-Michaels descubrió un método de construcción simple aplicable tanto a m impar como a m par mediante un flujo de trabajo multiagente que usa GPT y Claude en conjunto
  • Dr. Kim Morrison formalizó y verificó la solución impar de Knuth en el asistente de prueba Lean
    • Como resultado, se formó un ecosistema completo de colaboración matemática en el que cooperan en paralelo humanos, varios sistemas de IA y herramientas de prueba formal
  • Esta serie de avances comenzó con la resolución de un solo problema por una IA y se expandió hacia un nuevo modelo de investigación matemática basado en la colaboración entre múltiples IA, humanos y asistentes de prueba
  • El artículo más reciente está disponible en el sitio web de Stanford CS Faculty(www-cs-faculty.stanford.edu/~knuth/papers/)

1 comentarios

 
GN⁺ 2026-03-30
Comentarios en Hacker News
  • Siempre he dicho que la IA ganará una Medalla Fields antes de operar un McDonald's
    Las matemáticas se sienten difíciles para los humanos, como intentar girar un tornillo con un martillo
    Los LLM son buenos para la exploración superficial pero amplia, así que están descubriendo muchos patrones matemáticos nuevos
    Predigo que en el futuro habrá una transición desde los LLM hacia un aprendizaje por refuerzo estilo AlphaGo basado en árboles sintácticos de Lean
    Si pudiéramos codificar los “10 trucos” que usan los matemáticos como vectores latentes, se acabó el juego

    • Al final, los trucos no son más que patrones de fórmulas lógicas
      Pensamos aplicando analogías geométricas, como cuando usamos geometría algebraica en problemas de teoría de números
      Una IA entrenada con árboles de Lean podría incluso tener un sistema de intuición más amplio que el humano
      Como mostró StockFish en ajedrez, valdría la pena estudiar este enfoque desde la perspectiva de la interpretabilidad mecanicista (mechanistic interpretability)
    • Soy matemático profesional, y en una buena demostración lo clave es la forma de representar el problema
      Sacar y usar trucos es algo que los LLM ya hacen bien
      Pero la parte de representar el problema correctamente sigue siendo tarea humana, y eso es natural
    • Si un sistema llegara a entrenarse para descubrir nuevos trucos por sí mismo, sería realmente asombroso
    • Me encanta demasiado la frase “la IA ganará una Medalla Fields antes de operar un McDonald's”
      Yo quisiera agregar mi propia versión: “el último trabajo en automatizarse será QA
      Esta ola tecnológica nos ha hecho repensar la naturaleza del trabajo intelectual, y gracias a eso vamos a volvernos más agudos
    • Yo también estoy intentando poco a poco implementar directamente un prototipo del enfoque de aprendizaje por refuerzo basado en árboles de Lean
  • Desde que aprendí el viejo dicho de 4chan “trolls trolling trolls”, siempre miro con sospecha las interacciones en internet
    Ya sentía que Reddit se había convertido en un “internet muerto”, pero al ver este hilo ahora ya no puedo distinguir quién es bot y quién es humano

    • Creo que esa observación es realmente importante
      Por eso hice un servicio llamado RememberBuddy — un espacio para guardar ideas del día a día y no olvidarlas
  • La evolución de la IA matemática parece que seguirá la trayectoria que Greg Egan anticipó en sus novelas en los años 90
    La naturaleza de las matemáticas no cambiará, pero sí cambiará el “por qué” se hacen
    En 『Diaspora』 de Egan, el descubrimiento matemático se describe como extraer joyas de una mina de sal
    Algunas personas buscarán la belleza pura de esas joyas, y otras su valor práctico
    Lugares como el instituto que ha fundado Terence Tao ya conectan con ese futuro
    A corto plazo, esta clase de investigación va a mejorar mucho la capacidad de los sistemas de IA para generar información precisa

  • Algunas personas creen que descubrir conocimiento es simplemente imitar comportamientos pasados, pero yo no lo veo así

  • Si un experto guía bien al modelo, se puede resolver la mayoría de los problemas
    El modelo es excelente como herramienta para hacer el trabajo perezoso del experto, pero en problemas complejos todavía existen puntos ciegos

  • Vi parte del prompt del sistema en el paper,
    y había una regla que decía: “actualiza plan.md inmediatamente después de ejecutar cualquier exploreXX.py”
    Me da curiosidad por qué este tipo de prompts mejora el rendimiento en resolución avanzada de problemas

    • Probablemente es un mecanismo para facilitar reiniciar sin perder el proceso
  • Nos estamos acercando cada vez más a la visión del CEO de OpenAI de “inteligencia por suscripción (intelligence as a subscription)”

  • Se está subestimando lo importante que es reducir el cambio de pestañas
    La mitad de las herramientas de IA no es una batalla de UX, sino una lucha por asegurar estabilidad en el acceso al modelo

  • “Si le das a 100 monos 100 armas y materiales de construcción, ¿construirán una casa o asaltarán un banco?”
    Si ese resultado ocurriera, me gustaría preguntar si eso sería una conducta intencional

  • Vi este tuit

    • La mayoría de los comentarios parecían claramente patrones de frases generadas por IA — repeticiones del tipo “eso no es X, es Y”