- CoRT es un algoritmo que permite que un modelo de IA revise repetidamente sus propias respuestas y genere alternativas para elegir la mejor respuesta
- Al aplicarlo al modelo Mistral 3.1 24B, el rendimiento mejoró notablemente, especialmente en tareas de programación
- La IA genera una respuesta inicial y, a través de varias 'rondas de pensamiento', evalúa alternativas para seleccionar la respuesta final
- Este proceso incluye autoevaluación, generación competitiva de alternativas, mejora iterativa y profundidad de razonamiento dinámica
- CoRT se ofrece bajo licencia MIT y se agradecen contribuciones para mejorarlo
CoRT (Chain of Recursive Thoughts) 🧠🔄
Resumen
- Se presenta CoRT, un algoritmo que hace que la IA debata consigo misma para encontrar mejores respuestas
- El modelo de IA revisa repetidamente sus respuestas y genera alternativas para elegir la mejor respuesta
- Al aplicarlo al modelo Mistral 3.1 24B, el rendimiento mejoró notablemente, especialmente en tareas de programación
Cómo funciona CoRT
- La IA genera una respuesta inicial
- La IA decide cuántas 'rondas de pensamiento' necesita
- En cada ronda:
- Genera 3 respuestas alternativas
- Evalúa todas las respuestas
- Selecciona la mejor respuesta
- La respuesta final se convierte en la superviviente de este battle royale de IA
La salsa secreta
- Autoevaluación
- Generación competitiva de alternativas
- Mejora iterativa
- Profundidad de razonamiento dinámica
Contribuciones
- Si encontraste una forma de mejorarlo, los PR son bienvenidos
Licencia
- Se puede usar libremente bajo licencia MIT
1 comentarios
Opiniones de Hacker News
Hacer que un modelo de chat de IA proponga una respuesta a un problema y luego redacte un informe explicando por qué esa respuesta es correcta
Quisiera intentar, a mayor escala y en un modo siempre activo, un debate tipo "senado"
Como estrategia simple, al cerrar un mensaje pedir: "piensa una vez con una etiqueta de pensamiento, haz una autocrítica una vez con una etiqueta de crítica y, por último, piensa una vez más con una etiqueta de pensamiento antes de responder"
Es distinto de lo que esperaba por el título
Estoy diseñando un editor gráfico estilo Blueprint de Unreal Engine que, partiendo de la entrada del usuario, haga que varios agentes ejecuten tareas
Me pregunto si un equipo de agentes de IA operará como un equipo scrum y tendrá reuniones de seguimiento cada pocas horas
Una forma de hacer que un modelo de ML genere nuevas ideas es acercarse en diagonal a ideas que ya se intentaron y se descartaron, manteniendo ciertas restricciones de consistencia
Si no cambiamos rápidamente todas las GPU a energía verde, la Tierra se va a calentar mientras la IA debate consigo misma para encontrar la solución óptima
Hay ejemplos con CoRT y ejemplos sin CoRT, y los que no usan CoRT son mucho mejores
Este enfoque me recuerda a los creadores de contenido de YouTube