-
Sky-T1
-
Entrenar el modelo O1 Preview por 450 dólares
- Modelos como O1 y Gemini 2.0 muestran una gran capacidad de razonamiento para resolver tareas complejas, y lo logran mediante largos procesos internos de pensamiento.
- Sin embargo, la falta de acceso a los detalles técnicos y a los pesos del modelo se convierte en una barrera para la participación de la academia y la comunidad de código abierto.
- Como respuesta, han surgido varios esfuerzos destacados para entrenar modelos de razonamiento con pesos abiertos en el ámbito de las matemáticas, como Still-2 y Journey.
- El equipo NovaSky de UC Berkeley está explorando diversas técnicas para avanzar en la capacidad de razonamiento de modelos base y modelos ajustados por instrucciones.
- En esta investigación, se alcanza un rendimiento de razonamiento competitivo no solo en matemáticas, sino también en programación, dentro del mismo modelo.
-
Colaboradores
- Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica
Aún no hay comentarios.