10 puntos por xguru 2025-02-19 | 1 comentarios | Compartir por WhatsApp
  • La misión de xAI es comprender la naturaleza del universo, y para ello desarrolló Grok, una IA que prioriza la búsqueda de la verdad
  • Grok 3 muestra un rendimiento más de 10 veces superior al de Grok 2, gracias al esfuerzo de un gran equipo y a recursos de cómputo a gran escala
    • Grok proviene de la novela de Heinlein Stranger in a Strange Land y significa "entender algo de forma completa y profunda"
    • La empatía (Empathy) también juega un papel importante
  • xAI comenzó su primer modelo hace 17 meses, y Grok 1 era un modelo con 314B (314 mil millones) de parámetros
    • Luego pasó por Grok 1.5 y Grok 2, hasta llegar al desarrollo de Grok 3, con una mejora de rendimiento enorme
  • Centro de datos: xAI aceleró el desarrollo de Grok construyendo su propio centro de datos
    • Poner en marcha el primer clúster de 100 mil GPU tomó 122 días, y luego duplicó la capacidad a 200K en solo 92 días
    • Se trata del clúster H100 totalmente conectado más grande del mundo, y con todas esas GPU y ese poder de cómputo han venido mejorando Grok
  • Grok 3: rendimiento más de 10 veces superior al de Grok 2 (en realidad, más de 15 veces)
    • Completó el preentrenamiento a inicios de enero y todavía sigue entrenándose
  • Benchmarks: Grok 3 muestra un gran desempeño en razonamiento matemático general, ciencia y programación
    • La versión pequeña, Grok 3 Mini, también está al nivel de sus competidores
    • En particular, registró resultados de primer nivel en problemas de la competencia de matemáticas de preparatoria (AIME)
    • En la evaluación reciente de chatbots (Cha Arena) obtuvo un puntaje ELO superior a 1,400 y quedó en primer lugar entre todos los modelos

Nuevas funciones de Grok 3

  • Razonamiento avanzado (Advanced Reasoning)
    • Grok 3 no solo da respuestas simples, sino que cuenta con la capacidad de encontrar respuestas mediante un proceso de pensamiento profundo
    • Se reforzó su capacidad para analizar problemas, encontrar errores y explorar distintas posibilidades
    • Casos reales:
      • Cálculo de trayectorias de viaje a Marte: simula una trayectoria de ida y vuelta entre la Tierra y Marte y la muestra de forma visual
      • Desarrollo de un juego nuevo: genera al instante un juego nuevo que combina Tetris y Zuma
  • Capacidad de aprendizaje en tiempo real de Grok 3
    • Todos los días se aplican nuevas mejoras, y el rendimiento puede cambiar incluso de un día a otro
    • El modelo sigue mejorando incluso durante las pruebas
  • Mejoras de ingeniería con Grok 3
    • Internamente, Grok 3 también reduce cientos de horas de trabajo en programación y resolución de problemas
    • Al resolver problemas de matemáticas y programación competitiva, aprende la capacidad de detectar y corregir errores por sí mismo

Función de próxima generación: agente basado en Grok 3

  • Deep Search
    • Un nuevo motor de búsqueda con IA, que encuentra información con más profundidad que un buscador común
    • Analiza información de varios sitios y compara la información más reciente para ofrecer la respuesta más confiable
    • Ejemplos:
      • Consultar la fecha del próximo lanzamiento de Starship
      • Análisis de builds populares de Path of Exile
      • Predicción del ganador del torneo de básquetbol March Madness
  • Asistente de voz con IA (Voice Assistant)
    • Se añadirá una función para que el usuario pueda comunicarse con Grok como si estuviera teniendo una conversación real
    • Grok no se limita a convertir texto, sino que puede conversar de forma natural considerando tono de voz, emociones y entonación

Lanzamiento de Grok 3 y planes a futuro

  • Calendario de lanzamiento
    • Desde hoy, la versión beta de Grok 3 estará disponible para suscriptores Premium+
    • Si actualizan la app de X (antes Twitter), podrán usar las nuevas funciones
    • Lanzamiento del sitio independiente grok.com y de la app dedicada de Grok (iOS/Android)
  • Nueva opción de suscripción: Super Grok
    • Lanzamiento del modelo de suscripción Super Grok para usuarios que quieran probar rápido las funciones más nuevas
  • Planes futuros
    • Próximo lanzamiento de la API de Grok 3 (en unas semanas)
    • Próxima liberación como open source de Grok 3 (en los próximos meses)
    • Se está construyendo un clúster de próxima generación aún más potente (5 veces el rendimiento actual)
    • Planean fundar un estudio de videojuegos de IA para acelerar el desarrollo de juegos basados en IA

Conclusión

  • Grok 3 está abriendo una nueva dimensión en los modelos de IA, y xAI sigue trabajando para desarrollarlo aún más
  • Con su potente capacidad de razonamiento, motor de búsqueda con IA y función de asistente de voz, Grok evoluciona cada vez más hacia un verdadero asistente de IA
  • Elon Musk prevé que en el futuro la IA alcanzará logros académicos como la Fields Medal (el Nobel de las matemáticas)

1 comentarios

 
GN⁺ 2025-02-19
Opiniones en Hacker News
  • Karpathy describió su impresión inicial de Grok como del nivel de OpenAI o1-pro
  • Grok alcanzó un nivel de primer orden en un benchmark
  • La competencia en el campo de los LLM se está intensificando, lo cual es una buena noticia para los consumidores
    • Ojalá una empresa monopolística no absorba todo el valor
  • Hay evidencia de que se puede construir un LLM de vanguardia incluso con menos costo
  • El contenido grabado no resultó inspirador
    • No hubo nada nuevo; era algo que ya se sabía
  • Mucha gente piensa que están imitando a OpenAI
    • Consideran que OpenAI sigue mostrando de lo que es capaz
  • Hay que reconocer que xAI se puso al día rápidamente
    • Está avanzando no solo en modelos, sino también en producto
  • El mejor resultado de un Grok competitivo podría ser romper la percepción pública de que ChatGPT es el referente absoluto
  • Karpathy cree que esto está al nivel de o1-pro
  • OpenAI vuelve a demostrar que no existe una barrera técnica
    • Consideran razonable la propuesta de Elon para adquirir OpenAI
  • Elon es popular en China, así que puede conseguir ingenieros de IA con facilidad
    • Puede ofrecer acciones de xAI/XSpace/Neurallink
  • Les desean suerte a los inversionistas que valoran OpenAI en más de 100 mil millones de dólares
  • Planean publicar los pesos de Grok 2
  • Se imaginan un futuro en el que los LLM inserten publicidad personalizada