1 puntos por GN⁺ 2025-04-30 | 1 comentarios | Compartir por WhatsApp
  • CoRT es un algoritmo que permite que un modelo de IA revise repetidamente sus propias respuestas y genere alternativas para elegir la mejor respuesta
  • Al aplicarlo al modelo Mistral 3.1 24B, el rendimiento mejoró notablemente, especialmente en tareas de programación
  • La IA genera una respuesta inicial y, a través de varias 'rondas de pensamiento', evalúa alternativas para seleccionar la respuesta final
  • Este proceso incluye autoevaluación, generación competitiva de alternativas, mejora iterativa y profundidad de razonamiento dinámica
  • CoRT se ofrece bajo licencia MIT y se agradecen contribuciones para mejorarlo

CoRT (Chain of Recursive Thoughts) 🧠🔄

Resumen

  • Se presenta CoRT, un algoritmo que hace que la IA debata consigo misma para encontrar mejores respuestas
  • El modelo de IA revisa repetidamente sus respuestas y genera alternativas para elegir la mejor respuesta
  • Al aplicarlo al modelo Mistral 3.1 24B, el rendimiento mejoró notablemente, especialmente en tareas de programación

Cómo funciona CoRT

  • La IA genera una respuesta inicial
  • La IA decide cuántas 'rondas de pensamiento' necesita
  • En cada ronda:
    • Genera 3 respuestas alternativas
    • Evalúa todas las respuestas
    • Selecciona la mejor respuesta
  • La respuesta final se convierte en la superviviente de este battle royale de IA

La salsa secreta

  • Autoevaluación
  • Generación competitiva de alternativas
  • Mejora iterativa
  • Profundidad de razonamiento dinámica

Contribuciones

  • Si encontraste una forma de mejorarlo, los PR son bienvenidos

Licencia

  • Se puede usar libremente bajo licencia MIT

1 comentarios

 
GN⁺ 2025-04-30
Opiniones de Hacker News
  • Hacer que un modelo de chat de IA proponga una respuesta a un problema y luego redacte un informe explicando por qué esa respuesta es correcta

    • Hacer que un segundo modelo de IA evalúe ese informe y redacte otro señalando información que el modelo original no proporcionó o inconsistencias lógicas
    • Repetir este proceso hasta que el segundo modelo de IA quede satisfecho con la explicación del primero, o hasta que el primer modelo implemente todos los cambios solicitados
    • Aunque este método es algo complejo, cuando se ha probado ha dado resultados bastante buenos
  • Quisiera intentar, a mayor escala y en un modo siempre activo, un debate tipo "senado"

    • En lugar de responder a problemas individuales, dar una lista de tareas y dejar que el senado las resuelva
    • Pienso que podrían lograrse resultados impresionantes mediante distintas perspectivas y análisis crítico
    • Requiere muchos tokens, pero como el costo por token sigue bajando, parece posible
    • También existe la posibilidad de montar un servidor IRC dedicado a IA para crear un espacio compartido de debate donde cualquiera pueda conectar su propio modelo
  • Como estrategia simple, al cerrar un mensaje pedir: "piensa una vez con una etiqueta de pensamiento, haz una autocrítica una vez con una etiqueta de crítica y, por último, piensa una vez más con una etiqueta de pensamiento antes de responder"

    • Funciona bien
    • También sirve pedir que encuentre los 5 mayores problemas de una propuesta
  • Es distinto de lo que esperaba por el título

    • Se configuran roles de asistente, verificador cruzado y juez, y se avanza con preguntas y respuestas según cada rol
    • Pedirle a ChatGPT "explícalo si XYZ es cierto" y "explícalo si XYZ no es cierto" para ver cuál lado resulta más convincente
  • Estoy diseñando un editor gráfico estilo Blueprint de Unreal Engine que, partiendo de la entrada del usuario, haga que varios agentes ejecuten tareas

    • Los modelos Mistral small 3.1 y gemma 3 se sienten como los primeros modelos medianamente capaces que pueden ejecutarse en local
    • Si intentas ejecutar Python en un bucle y le indicas que explore el mundo, empieza a descargar y leer noticias, entre otras cosas
  • Me pregunto si un equipo de agentes de IA operará como un equipo scrum y tendrá reuniones de seguimiento cada pocas horas

    • Me pregunto si replicarán una burocracia gubernamental, con agentes debatiendo temas todo el día para encontrar la mejor postura
  • Una forma de hacer que un modelo de ML genere nuevas ideas es acercarse en diagonal a ideas que ya se intentaron y se descartaron, manteniendo ciertas restricciones de consistencia

  • Si no cambiamos rápidamente todas las GPU a energía verde, la Tierra se va a calentar mientras la IA debate consigo misma para encontrar la solución óptima

  • Hay ejemplos con CoRT y ejemplos sin CoRT, y los que no usan CoRT son mucho mejores

    • Es una elección de ejemplos extraña
  • Este enfoque me recuerda a los creadores de contenido de YouTube

    • Escriben scripts del juego como si fuera una pista de carreras para llegar a un objetivo, y repiten hasta encontrar la solución más rápida
    • A eso se le llama aprendizaje automático o aprendizaje por refuerzo
    • La comprensión ignorante sobre la IA suele ser bastante parecida