1 puntos por GN⁺ 2025-02-22 | Aún no hay comentarios. | Compartir por WhatsApp
  • Sky-T1

  • Entrenar el modelo O1 Preview por 450 dólares

    • Modelos como O1 y Gemini 2.0 muestran una gran capacidad de razonamiento para resolver tareas complejas, y lo logran mediante largos procesos internos de pensamiento.
    • Sin embargo, la falta de acceso a los detalles técnicos y a los pesos del modelo se convierte en una barrera para la participación de la academia y la comunidad de código abierto.
    • Como respuesta, han surgido varios esfuerzos destacados para entrenar modelos de razonamiento con pesos abiertos en el ámbito de las matemáticas, como Still-2 y Journey.
    • El equipo NovaSky de UC Berkeley está explorando diversas técnicas para avanzar en la capacidad de razonamiento de modelos base y modelos ajustados por instrucciones.
    • En esta investigación, se alcanza un rendimiento de razonamiento competitivo no solo en matemáticas, sino también en programación, dentro del mismo modelo.
  • Colaboradores

    • Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica

Aún no hay comentarios.

Aún no hay comentarios.