Grok Code Fast 1
(x.ai)- grok-code-fast-1 de xAI es un modelo de codificación con IA ultrarrápido para desarrolladores, con respuestas veloces y funciones amigables con el IDE
- Este modelo fue preentrenado principalmente con conjuntos de datos de programación y, mediante evaluaciones con usuarios reales, fue diseñado para destacar en el uso de herramientas como grep, terminal y edición de archivos
- Su rendimiento alcanza una velocidad de generación de 190 tokens por segundo y una puntuación de 70.8% en SWE-Bench-Verified, con fortalezas en múltiples lenguajes como TypeScript, Python, Java, Rust, C++ y Go
- El precio está fijado en $0.20 por 1 millón de tokens de entrada, $1.50 de salida y $0.02 para entrada en caché, y en algunas plataformas asociadas (GitHub Copilot, Cursor, etc.) se ofrece gratis por tiempo limitado
- Próximamente también se lanzarán variantes con soporte para entrada multimodal, llamadas paralelas a herramientas y contexto ampliado
Resumen general
- grok-code-fast-1 de xAI es un modelo de codificación con IA ultrarrápido desarrollado para resolver los problemas de lentitud en entornos reales de desarrollo, donde el razonamiento iterativo y el uso de herramientas ocurren con frecuencia
- A partir de la retroalimentación de ingenieros en activo, fue reconstruido desde cero como una arquitectura de modelo rápida, ágil y adecuada para tareas reales
- El equipo de inferencia e ingeniería de cómputo introdujo numerosos métodos innovadores en una tecnología de servicio extremadamente rápida
- Los usuarios pueden percibir una experiencia en la que ya se han realizado varias llamadas a herramientas incluso antes de terminar de leer el flujo de pensamiento
- Gracias a la optimización del caché de prompts, logró una tasa de aciertos de caché superior al 90% en entornos asociados
Diseño y conjuntos de datos
- Se construyó el entorno de entrenamiento sobre una enorme base de datos de preentrenamiento centrada en programación
- Se realizó un postentrenamiento de alta calidad con datos reales de pull requests y escritura de código
- Mediante una estrecha colaboración con diversos socios de lanzamiento, se mejora continuamente el comportamiento del modelo dentro de plataformas agentic
Características principales y entornos compatibles
grok-code-fast-1maneja con solidez herramientas de desarrollo comunes como grep, terminal y edición de archivos- Los usuarios pueden aprovecharlo directamente en entornos de desarrollo principales como los IDE
Rendimiento de programación
- Da soporte a toda la pila de desarrollo de software
- Muestra un uso sobresaliente en TypeScript, Python, Java, Rust, C++ y Go
- Incluso con supervisión mínima, procesa con rapidez y precisión diversas tareas de programación como crear proyectos desde cero, responder preguntas sobre codebases y corregir bugs con precisión
- Grok Code Fast 1 ofrece la respuesta más rápida entre los modelos actuales
- Si se usa dividiendo el trabajo en unidades pequeñas, resulta muy favorable para construir flujos de trabajo iterativos y veloces
- Como ejemplo real, completó un prototipo de Battle Simulator en solo un día dentro del entorno de Cursor
- Es eficiente planear funciones grandes, dividirlas por etapas y ejecutarlas de forma iterativa
Política de precios
- $0.20 por cada 1 millón de tokens de entrada
- $1.50 por cada 1 millón de tokens de salida
- $0.02 por cada 1 millón de tokens de entrada almacenados en caché
- Con un gran rendimiento y un precio económico, permite resolver tareas diarias de programación de forma rápida y eficiente
Rendimiento y evaluación del modelo
- La velocidad de procesamiento de tokens (Tokens Per Second, TPS): 190 se ubica al nivel más alto de la industria
- Frente a otros modelos (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4), muestra una fuerte competitividad tanto en precio como en velocidad de procesamiento
- Se combinaron diversos benchmarks públicos y pruebas reales de desarrolladores
- Alcanzó 70.8% en el subconjunto de SWE-Bench-Verified
- Al combinar evaluaciones humanas periódicas con ingenieros de campo y pruebas automatizadas, se maximiza la utilidad práctica y la satisfacción con el modelo
Planes futuros y guía de uso
- Está disponible a través de la API oficial y de socios principales, y también ofrece una prueba gratuita por tiempo limitado
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf, etc.
- Promete actualizaciones continuas y un ciclo de mejora rápido
- También se están entrenando nuevas variantes con funciones como entrada multimodal, llamadas paralelas a herramientas y soporte de contexto ampliado
- También se ofrece una guía de prompt engineering
- Es posible compartir opiniones en la model card y en canales de retroalimentación (Discord, etc.)
1 comentarios
Opiniones en Hacker News
Ayer lo probé con Cline; es rápido, encaja bien con el flujo agentic y la calidad del código es bastante buena. No entiendo por qué este hilo es tan negativo (incluso me marcaron mientras escribía). Me parece que este modelo está bien, se siente al nivel de
gpt5-minio mejor. Uségpt5-minicomo principal durante varios días y, además de ajustarse al presupuesto, resolvía bien lo que necesitaba hacerCosas que me llamaron la atención:
bs4) y aun así completó la tarea sin problemas; no tuvo líos en un contexto altoGPT5-minia veces se confundía al editar archivos durante la tarea y terminaba fallandoEn general está bien; por el precio, sirve incluso como daily driver. También me imagino usar
Opus+gpt5 highcomo planner y este modelo como implementer. Como es rápido, también se ve interesante para una configuración estilopass@xen paraleloEstá bueno que haya varias opciones en todos los niveles. Hace falta que distintos proveedores compitan para que se mantengan bajo presión y bajen los precios.
gpt5-minicuesta 2$/MTok y este modelo ronda 1.5$/MTok, así que se siente casi “gratis”. No entiendo este ambiente tan negativoQwen3-Coder-480B(alojado en Cerebras) cuesta 2$/Mtok por entrada y salida a través de OpenRouterQwen3-Coder-480Bes mejor¿Deberíamos considerar que el rendimiento es bueno si usa como la mitad del context length? En
qwen3-coderda la impresión de que se confunde en 65k/256k, y además es 50% más caro quegrokLeí bien la reseña; me da curiosidad cómo se compara con
claude codeYo pienso algo parecido; he estado usando este modelo últimamente y está bastante bien, además de ser muy rápido
Lo interesante es que el benchmark que este modelo destaca es la velocidad de salida de tokens; incluso le pusieron “fast” en el nombre
En general, supongo que los ingenieros de software considerarían más importante la calidad de los tokens que la velocidad
La clave es qué tan rápido sea
No es la peor métrica que ha inventado xAI
Probé la API gratuita de Cerebras (
Qwen Coder 480b,gpt-oss-120b; no es patrocinado) y de verdad va rapidísimo, como a 3000 tokens por segundoDepende del uso
La velocidad sí importa muchísimo
Claude Sonnet 4y además rápido, podría cambiar por completo el juego en coding agenticMe da curiosidad qué están usando en HN como asistente de coding con IA; me gustaría oír recomendaciones de plugins de VSCode y consejos de uso real
Me pregunto si esta es la versión de “coding” que salió cuando mucha gente decía que el rendimiento de código de
Grok-4era maloSi es flojo en benchmarks, da la impresión de que se apoyan en una métrica más fácil de inflar (la velocidad)
Busqué y lo único que encontré fue una publicación en Reddit de una cuenta claramente spam elogiando ese modelo
Enlace a esa cuenta
Me da la impresión de que está basado en
Grok 3;Grok 3era rapidísimo y estaba especializado en programaciónSegún el benchmark interno,
grok-code-fast-1saca 70.8% enSWE-Bench-Verifiedcompleto, y me gustaría ver un poco más esa herramienta de benchmarkEn reportes de terceros anda más cerca de 57.6%
Enlace relacionado
Puede ser un nitpick, pero me sorprendió que apenas abrí el sitio el formato de fechas estuviera tan mal hecho (mezclan sin orden día/mes/año)
No solo confunde; además rompe el ordenamiento
Probé ordenar por la columna de fechas y no tuvo ningún sentido (ordenó según elementos intermedios)
Si no cuidan ni algo tan básico, me hace sospechar que su código también puede estar flojo
[Algunos países todavía usan ese formato, pero la mayoría ya se pasó al estándar]
Aun así, comparado con otros modelos, el resultado sí se ve bueno
Incluso con la versión base de
Grok 4he visto resultados bastante decentesGPT-5me resulta más útil queSonnet 4Cuando le preguntas por distintas opciones de arquitectura, da respuestas muy buenas y me gusta que guíe la resolución paso a paso
Prefiero ese proceso de ir afinando hacia lo que realmente quiero, en lugar de que reescriba todo el código de una sola vez en modo “one-shot”
Creo que
Opus 4.1o la serieSonnetno se evalúan bien con métricas de resolución one-shot; lo importante de verdad es qué tan bien cumplen el rol de asistentegpt-5también, si se encapricha con una dirección que yo no quiero, puede repetir el mismo comportamiento aunque hables mucho con élPuede que
Sonnet 4esté por debajo deGPT-5en diseño de arquitectura o análisis profundo, pero cuando ya hay un plan detallado y solo toca sacar mucho código,Sonnet 4lo hace mejorDespués de probar Grok durante varios días, más bien me dio la impresión de que va en retroceso
Hacía tiempo que no me pasaba que me borrara partes de mi código al azar
Los modelos de coding de gama alta últimamente ya son bastante confiables, pero siento que Grok todavía no está en ese punto
Da igual que sea rápido o gratis: si no puedo confiarle mi código, no me sirve como herramienta
Probé
Grok Code Fast 1gratis en Kilo Code y el resultado fue muy maloGPT 5 Miniy, de forma irónica, también más lento¿Full Self Coding?
Me gustaría saber qué plataforma/lenguaje usas
¿Que borre parte del código de verdad es un problema? ¿No tienes control de versiones?
Hace cosas absurdas y raras a una velocidad impresionante, y eso no es bueno
Sirve para tareas simples y concretas como endpoints CRUD, archivos
i8ny cosas así, pero fuera de eso no tantoYo justamente uso este modelo para eso
Le pedí que mejorara un
Justfiley lo enredó por completo, destruyó todo y se quedó en un loop infinitoIncluso en la etapa stealth del modelo ‘sonic’, ya era rápido, pero la calidad no era tan precisa como debería
Sí generaba tests y los ejecutaba repetidamente, pero en realidad no validaba el comportamiento esperado, solo comprobaba llamadas a mocks
Tiene el límite de no prestar suficiente atención a los patrones de uso reales
A mí me pareció impresionante