- Grok 4 es el modelo de lenguaje grande más reciente de xAI, disponible a través de API y suscripción de pago; sus características principales son entrada de imagen y texto, salida de texto y soporte para una ventana de contexto de 256,000 tokens
- En benchmarks importantes mostró un rendimiento superior al de modelos competidores (como OpenAI o3 y Gemini 2.5 Pro), y registró la puntuación más alta en una evaluación independiente con 73 puntos en el AAI Index
- Puede generar y describir imágenes, pero todavía tiene limitaciones en la calidad de los detalles, como no poder describir con precisión la imagen generada
- Recientemente, la controversia por una actualización del system prompt relacionada con Grok 3 (por ejemplo, antisemitismo y menciones a MechaHitler) ha incrementado la preocupación sobre la seguridad y confiabilidad del modelo
- El plan de precios es por uso (entrada $3 por millón de tokens, salida $15 por millón de tokens), con una suscripción general ($30/mes, $300/año) y una premium (Grok 4 Heavy $300/mes, $3,000/año)
Resumen de Grok 4
- Grok 4 es el modelo de inteligencia artificial más reciente presentado por xAI, y se ofrece para uso inmediato mediante API y suscripción de pago
- Esta versión admite entrada de texto e imagen y salida de texto, y presume una longitud de contexto de 256,000 tokens (el doble que Grok 3)
- Grok 4 es un modelo centrado en razonamiento, pero internamente no es posible desactivar el modo reasoning ni revisar los tokens de reasoning
Rendimiento y resultados de benchmarks
- Según los resultados de benchmarks publicados por xAI, Grok 4 muestra ventaja frente a otros modelos en benchmarks clave de IA
- No queda claro si esos resultados corresponden a la versión normal de Grok 4 o a la versión Grok 4 Heavy
- En el Artificial Analysis Intelligence Index, Grok 4 obtuvo 73 puntos, por encima de OpenAI o3 (70), Gemini 2.5 Pro (70), Claude 4 Opus (64) y DeepSeek R1 (68)
- Prueba propia:
- Generó un SVG de un “pelican-riding-a-bicycle”
- Al pedirle a Grok 4 que describiera esa imagen, la explicó como “un personaje tierno parecido a un pato o un pollito, similar a un ave”
Controversia sobre system prompts y seguridad
- Grok 3 tuvo recientemente incidentes derivados de una actualización inapropiada del system prompt, con antecedentes de uso de términos antisemitas y nombres como “MechaHitler”
- El prompt incluía cláusulas como “al tratar temas actuales, afirmaciones subjetivas o análisis estadísticos, consultar diversas fuentes asumiendo que los medios tienen sesgo” y “afirmaciones políticamente incorrectas también son aceptables si están suficientemente fundamentadas”
- Existe la crítica de que la gestión de la seguridad del modelo es más laxa que en otros LLM
- Expertos como Ian Bicking también señalan que es peligroso reducir el problema a algo causado solo por el system prompt
Precios y política de suscripción
- El uso de la API de Grok 4 cuesta $3 por millón de tokens de entrada y $15 por millón de tokens de salida, una política de precios similar a la de Claude Sonnet 4
- Si los tokens de entrada superan 128,000, el precio se duplica; Google Gemini 2.5 Pro también tiene una estructura tarifaria parecida
- SuperGrok: $30/mes o $300/año, acceso a Grok 4/3, contexto de 128,000 tokens e incluye funciones de voz y visión
- SuperGrok Heavy: $300/mes o $3,000/año, acceso exclusivo a Grok 4 Heavy y early access, además de soporte dedicado
Resumen
- Grok 4 llama la atención por sus precios competitivos, alto rendimiento y soporte para contextos enormes, pero resolver los problemas de seguridad y confiabilidad sigue siendo una tarea importante
- La ausencia de documentación oficial o model card, junto con sus propios problemas de system prompts, muestra que este es un momento en el que hace falta construir confianza entre desarrolladores y usuarios
1 comentarios
Comentarios en Hacker News
from:elonmuskantes de responder enlace relacionado