Cursor AI presenta el modelo Composer 1.5

Hace unos meses, lanzamos Composer 1, nuestro primer modelo de programación basado en agentes. Desde entonces, hemos logrado mejoras significativas en la capacidad de programación del modelo.

El recién lanzado Composer 1.5 logra un sólido equilibrio entre velocidad e inteligencia para el uso diario. Composer 1.5 fue construido ampliando 20 veces más el aprendizaje por refuerzo sobre el mismo modelo base preentrenado. Los recursos de cómputo invertidos en el postentrenamiento de Composer 1.5 superan ampliamente la cantidad utilizada en el preentrenamiento del modelo base.

Durante este escalado, la capacidad de programación sigue mejorando de forma constante. Según mediciones de benchmarks internos basados en problemas reales de programación, este modelo superó rápidamente a Composer 1 y mostró una mejora continua en el rendimiento. Las mejoras son especialmente notorias en tareas de alta dificultad.

Composer 1.5 es un modelo de razonamiento. En el proceso de responder a una consulta, el modelo genera tokens de pensamiento para razonar sobre el codebase del usuario y planificar los siguientes pasos. Confirmamos que estas etapas de pensamiento son clave para la inteligencia del modelo. Al mismo tiempo, queríamos mantener la velocidad y la interactividad de Composer 1.5 para el uso diario. Para lograr ese equilibrio, el modelo fue entrenado para responder rápidamente con un pensamiento mínimo en problemas fáciles, y para pensar hasta encontrar una respuesta satisfactoria en problemas difíciles.

Para manejar tareas de ejecución prolongada, Composer 1.5 cuenta con una función de auto-resumen. Esto permite que el modelo siga explorando soluciones incluso cuando el contexto disponible se ha agotado. Entrenamos a Composer 1.5 en la capacidad de auto-resumirse como parte del aprendizaje por refuerzo (RL), pidiéndole que genere resúmenes útiles cuando el contexto se agota durante el entrenamiento. En ejemplos difíciles, este proceso puede ocurrir de forma recursiva varias veces. Confirmamos que, gracias a la función de resumen automático, el modelo puede mantener su precisión original incluso con cambios en la longitud del contexto.

Composer 1.5 es un modelo mucho más potente que Composer 1, y se recomienda para uso interactivo. El proceso de entrenamiento de este modelo demuestra que el RL para programación puede seguir escalándose de manera sostenida junto con mejoras predecibles en la inteligencia.

Los precios pueden verse aquí -> https://cursor.com/docs/models

Cursor AI presenta el modelo Composer 1.5

Lecturas relacionadas

1 comentarios