- Se lanzó Grok-2 y Grok-2 mini para los usuarios de Grok en la plataforma X
- Grok-2 cuenta con capacidades de chat, programación y razonamiento muy mejoradas frente al modelo anterior, Grok-1.5
- Una versión inicial de Grok-2, probada en la tabla de clasificación de LMSYS con el nombre
sus-column-r, mostró un rendimiento superior al de Claude 3.5 Sonnet y GPT-4-Turbo
Modelo de lenguaje y funciones de chat de Grok-2
- Se envió una versión inicial de Grok-2 al Chatbot Arena de LMSYS (una conocida herramienta de benchmark competitivo de LLM) con el nombre sus-column-r
- Superó a Claude y GPT-4 en la puntuación Elo general del modelo
Benchmarks
- El modelo Grok-2 fue evaluado en una serie de benchmarks académicos, incluyendo razonamiento, comprensión lectora, matemáticas, ciencias y programación
- Grok-2 y Grok-2 mini muestran mejoras significativas frente al modelo anterior Grok-1.5
- Alcanzaron un rendimiento competitivo frente a otros modelos de última generación en áreas como conocimiento científico de nivel posgrado (GPQA), conocimiento general (MMLU, MMLU-Pro) y problemas de olimpiadas matemáticas (MATH)
- Grok-2 mostró rendimiento de última generación en razonamiento matemático visual (MathVista) y preguntas y respuestas basadas en documentos (DocVQA)
Probar Grok en X con información en tiempo real
- Han estado mejorando Grok de forma continua en la plataforma X
- Los usuarios de X Premium y Premium+ pueden acceder a dos nuevos modelos: Grok-2 y Grok-2 mini
- Se puede acceder a Grok-2 desde la pestaña Grok de la app de X, y es un asistente de IA de última generación con funciones avanzadas tanto en texto como en comprensión visual
- Grok-2 mini es un modelo más pequeño pero capaz, que ofrece un equilibrio entre velocidad y calidad de respuesta
- Están experimentando con el modelo FLUX.1 en colaboración con Black Forest Labs y ampliando las capacidades de Grok en X
Crear con Grok usando la Enterprise API
- A finales de este mes planean lanzar Grok-2 y Grok-2 mini para desarrolladores a través de una nueva plataforma Enterprise API
- La nueva API está construida sobre una nueva pila tecnológica personalizada que permite despliegues de inferencia multirregión con acceso de baja latencia en todo el mundo
- Ofrece funciones de seguridad mejoradas, como autenticación multifactor obligatoria, estadísticas de tráfico detalladas y análisis avanzado de facturación
- Proporciona una API de administración para integrar la gestión de equipos, usuarios y facturación con herramientas y servicios internos existentes
What is Next?
- Grok-2 y Grok-2 mini ya se están lanzando en X
- Hay mucha expectativa por varias funciones impulsadas por IA, como capacidades de búsqueda mejoradas de Grok, análisis más profundos sobre publicaciones de X y mejores funciones de respuesta
- Próximamente planean presentar una vista previa de la comprensión multimodal como parte central de la experiencia Grok en X y en la API
- Desde el anuncio de Grok-1 en noviembre de 2023, X.AI ha avanzado a gran velocidad impulsada por un equipo pequeño pero con altísima densidad de talento
- Con la introducción de Grok-2, se posiciona en la primera línea del desarrollo de IA
- Están enfocados en avanzar las capacidades centrales de razonamiento con un nuevo clúster de cómputo
- Compartirán muchos más avances en los próximos meses
- "Están buscando personas que se unan a un equipo pequeño y enfocado, comprometido con construir las innovaciones más influyentes para el futuro de la humanidad"
Aún no hay comentarios.