1 puntos por princox 1 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp
  • Elon Musk reveló personalmente en X (Twitter), entre el 15 y 17 de mayo, el estado del entrenamiento del nuevo modelo de Grok
  • La versión pública actual (v4.3) se basa en el modelo fundacional V8 de 0.5T parámetros, y sigue mejorando cada pocos días
  • Señaló que el V9, en desarrollo interno, tiene 1.5T parámetros y que “acaba de terminar su entrenamiento”
    • Musk suele llamar a esta etapa "pre-training", pero señaló que es un “término incorrecto”
    • Frente a V8, hubo grandes mejoras en la curación de datos, la receta de entrenamiento y la escala del modelo
    • A diferencia de V8, entrenado en Hopper, V9 está optimizado para la arquitectura Blackwell
  • Como siguiente paso, planean añadir datos de Cursor al entrenamiento de refuerzo (supplemental training, etapa que suele llamarse "mid-training")
  • Musk comentó que “V9 ya muestra un rendimiento muy sobresaliente incluso antes de incorporar los datos de Cursor”

▍Contexto: acuerdo SpaceX-Cursor

  • En abril de 2026, SpaceX (fusionada con xAI en febrero del año pasado) firmó un acuerdo de opción para adquirir Cursor dentro del año por 60 mil millones de dólares, o pagar 10 mil millones de dólares como compensación por la colaboración
  • Justo antes de este acuerdo, los ingenieros senior de Cursor Andrew Milich y Jason Ginsberg se movieron a xAI, incorporándose a una estructura en la que reportan directamente a Musk
  • La idea es combinar la supercomputadora xAI Colossus (cómputo equivalente a 1 millón de H100) con los productos para desarrolladores y la red de distribución de Cursor
  • La dinámica en la que Cursor alquilaba decenas de miles de chips de xAI para entrenar su propio modelo (Composer) quedó formalizada con este contrato
  • Es decir, la mención sobre el “entrenamiento de refuerzo con datos de Cursor” para Grok V9 significa que la sinergia de datos del acuerdo con opción de adquisición ya empezó a entrar en el pipeline real de entrenamiento del modelo, y no es solo una colaboración simple

▍Para leer

  • Resulta interesante que Musk negara públicamente el término estándar de la industria "pre-training" y enfatizara la distinción entre etapas como "supplemental training" y "mid-training"
  • Lo que posee Cursor no es solo código, sino “datos de comportamiento de programación” como edición en tiempo real, resultados de pruebas, logs y capturas de pantalla de millones de desarrolladores → el activo más caro para entrenar agentes de código
  • En un mercado de programación dominado por Anthropic Claude y OpenAI Codex, esto se interpreta como la carta más directa de xAI para cerrar la brecha

Fuente:

Aún no hay comentarios.

Aún no hay comentarios.