xAI presenta Grok 4.3
(docs.x.ai)- Ofrece una ventana de contexto de 1 millón de tokens y funciones de API orientadas a desarrolladores como razonamiento, llamadas a funciones y salidas estructuradas
- A diferencia de Grok 4.20 anterior, el razonamiento está siempre activado, realizando automáticamente un proceso de pensamiento antes de responder a todas las consultas
- Reducción de aproximadamente 40% en el precio de los tokens de entrada y de aproximadamente 60% en los tokens de salida, lo que reduce de forma significativa los costos frente al modelo anterior
- Precios: entrada $1.25/1M tokens, entrada en caché $0.20/1M, salida $2.50/1M
- Se ubica entre los modelos más baratos de su nivel de inteligencia
- Gran mejora en el rendimiento para tareas agenticas — registró una puntuación ELO de 1500 en el benchmark GDPval-AA, subiendo 321 puntos frente a Grok 4.20 y superando a Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini y otros
- Primer modelo de la API de xAI con soporte de entrada de video nativa, procesando directamente cuadros de video mediante un codificador de visión
- Alcanzó el primer lugar en razonamiento legal (79.3% de precisión en CaseLaw v2) y el primer lugar en finanzas corporativas (CorpFin), con un salto de 25 puntos en razonamiento legal frente a Grok 4.20
- En la interfaz de chat permite generar directamente diapositivas de presentaciones, así como crear y descargar en tiempo real archivos PDF, Excel y PowerPoint durante la conversación
- Incluye un entorno integrado de ejecución de código, permitiendo que el modelo maneje la escritura, ejecución y generación de archivos
- También se lanzan oficialmente la API de Speech-to-Text (25 idiomas, con soporte para separación de hablantes) y la API de Text-to-Speech
- Con una puntuación de 53 en el Artificial Analysis Intelligence Index, supera a Muse Spark y Claude Sonnet 4.6, y se sitúa en la frontera de Pareto de inteligencia por costo
- Límite de tasa de 1,800 solicitudes por minuto / 10 millones de tokens, con cobro adicional por encima de 200K
- El nombre del modelo es grok-4.3 y las regiones compatibles son us-east-1 y eu-west-1
1 comentarios
Comentarios de Hacker News
Como alguien que tiene el inglés como segundo idioma, Grok destaca especialmente para captar y reproducir el tono y el nivel de formalidad de un texto
Parece entender mejor los matices humanos sutiles del lenguaje que otros proveedores importantes, y ChatGPT suele volverse demasiado rígido y formal o caer en un informal raro tipo “aye guvnor”. Claude a veces es mejor, pero no siempre
En general, Grok se siente más “humano” de una forma difícil de definir. Por ejemplo, si le preguntas “¿este mensaje comunica más o menos bien la idea dentro de este largo?”, responde como una persona con un sí/no o con sugerencias de edición manteniendo el tono y la longitud, mientras que ChatGPT todavía termina escribiendo un ensayo largo y poco claro
Últimamente también siento que el dictado por voz de Grok está bastante bien. En la función de presionar el micrófono para preguntar, ChatGPT acierta un 90~95% con mi acento, la entrada por voz de Android Gboard anda por el 75%, pero Grok sorprendentemente llega como al 98%
Los tres manejaban bien un tono más formal, pero en tono casual el único que no daba vergüenza ajena era GPT-4.1
Por cierto, Grok fue el más rápido y barato, y Claude el más lento y caro
Creo que es una ventaja de haber sido entrenado mucho con datos de Twitter. Aunque me preocupa que, como cada vez hay más contenido generado por IA en Twitter, si siguen entrenándolo ahí esa naturalidad pueda empeorar
No lo digo de forma despectiva, pero esto parece más una impresión
Para otras cosas sigue prefiriendo ChatGPT
Grok es mi modelo favorito para chatear, y también el que más me gusta en modo voz
Parece ser el único modo voz que no te redirige a un modelo extremadamente barato, como Haiku, y dentro de los de nivel frontier fue el de mayor calidad
Si te suscribes a SuperGrok, puedes crear un “council” de agentes, cada uno con su propio system prompt, y cuando preguntas algo se lo consulta a todos en paralelo antes de sacar una conclusión
Eso sí, ojalá invirtieran un poco en la app. De hecho, la única razón por la que no termino suscribiéndome a SuperGrok es la app
No hay soporte para MCP/apps conectadas, y aunque lo anunciaron, todavía no se puede usar. No puedes conectar Grok con nada, así que cuesta usarlo para trabajo serio
Los proyectos todavía no están soportados en la app, así que en cuanto mueves algo a un proyecto, desaparece de todas las apps nativas
No hay forma de agregar directamente al proyecto artefactos como documentos Markdown generados, así que tienes que exportarlos a PDF/Markdown y volver a importarlos. Ni siquiera existe exportación de artefactos. Es difícil hacer evolucionar dinámicamente un proyecto con nueva información, así que resulta incómodo para trabajo serio en proyectos
Tampoco hay memoria ni forma de revisar otros chats, así que cada conversación empieza completamente desde cero
Dentro de los proyectos tampoco existe modo voz
Si alguien de xAI está leyendo esto, sería bueno que agregaran хотя бы algunas de estas cosas
Claude recuerda que tengo una parrilla, así que incluso en conversaciones totalmente irrelevantes o que solo son sobre comida, mete que eso podría ir bien con BBQ
Su personalidad también está bien y se siente mucho más natural que el chat web de Gemini. Mi única queja es que siempre intenta sugerir “siguientes pasos”, aunque parece que todos estos modelos hacen eso
No sé si esos “siguientes pasos” son una forma de subir costos o si todavía no han aprendido el patrón natural de conversación para distinguir entre preguntas que solo requieren una respuesta corta y conversaciones largas de exploración. Igual, si uno les pide que no hagan eso, deberían obedecer
Ahora mismo el plan Heavy te da algo de crédito API, así que se puede usar Grok un poco para programar, pero no parece que valga 300 dólares
No digo que hagan su propio harness grok-code; con que pudiera usarse desde herramientas ya existentes sería útil. Probablemente la compra de Cursor termine apuntando a algo así
No está claro si SuperGrok te da una API key
En nuestras pruebas, Grok 4.3 es un modelo peculiar
Es de los más rápidos, y frente a otros modelos de rendimiento similar da respuestas mucho más cortas y con mayor densidad de tokens
Pero su capacidad general de razonamiento para código no compite con los grandes lanzamientos de abril, y ni Grok 4.20 ni Grok 4.3 lograron empujar mucho el frente de inteligencia desde Grok 4
Grok 4.3 sí es mejor en tareas de tipo agente, y sería justo decir que está más o menos al nivel de GPT 5.1 / Gemini 3 Pro Preview, pero siendo mucho más rápido y barato. Así que, dentro de lo suyo, sin duda es un buen lanzamiento
Entre los modelos de pesos abiertos publicados recientemente hay varios más inteligentes, aunque más lentos
El benchmark completo está en https://gertlabs.com/rankings
Ese parece ser el principal caso de uso de Grok, y también me pregunto si existe algún benchmark sobre eso
Últimamente Grok se ha convertido en mi motor de búsqueda
Parece ser la única IA con acceso a publicaciones de X, y aparte de eso en general da más la impresión de “estar buscando” que otros modelos de lenguaje grandes
Durante los incidentes relacionados con Irán quería enterarme de la situación apenas se iba reportando, y ambos funcionaron bastante bien
Viendo el panorama actual, Claude parece ser para empresas y gobierno, Codex para desarrolladores, y no sé para qué sería Grok
Lo único con lo que he escuchado asociar a Grok es roleplay y racismo
Grok hizo sin problema una tarea puntual de clasificación que todos los demás modelos rechazaron
Creo que para un modelo casi-frontier con menos guardrails hay sorprendentemente muchos usos reales útiles en zonas grises. El modelo grok-fast además es barato
Se le considera inconsistente y caótico
La gente suele usar GLM y DeepSeek por API, y en local modelos fine-tuned de Gemma4 y Mistral
El mercado del roleplay es relativamente antiguo y maduro, así que los usuarios parecen ser conscientes del costo y quieren que el modelo se adapte a su flujo de trabajo y preferencias. Por eso cosas como Opus gustan por inteligentes, pero se consideran demasiado caras y tercas
Puede ser un dato interesante para ver cómo evolucionarán otros mercados en el futuro
Siempre lo uso para preguntas como “¿cuál es el tiling window manager que la gente cool de Twitter dice que es el mejor últimamente?”
También Grok suele responder preguntas medio sospechosas o ambiguas. Algo como “encuéntrame un sitio gray-market para licencias de Windows”
Un modelo de lenguaje es solo un sistema, y tampoco veo muy claro por qué debería ser responsable de cómo el usuario use sus resultados. Es como decir que un bolígrafo es una herramienta “racista” e inútil porque alguien podría escribir cosas horribles en la pared de un baño
Probablemente vives en un lugar donde el acoso es delito, y quizás también hay normas sobre expresión. ¿No debería bastar con eso? Me pregunto por qué todos los esfuerzos de toda la gente del planeta deberían alinearse con modas éticas que cambian cada pocos años
Solo hay que adivinar qué modelo de lenguaje grande fue el mayor outlier y en qué tipo de preguntas difería de todos los demás
Me da curiosidad genuina si la gente realmente usa Grok para algo más que entender memes o tuits de Twitter
No actúa tanto como un guardián como otros modelos. Busco mucho material descatalogado con copyright huérfano desde hace décadas, y los modelos principales se niegan mientras te sermonean por intentar encontrar material con copyright. Grok sí lo hace [0]
[0] A veces hay que hacerle un jailbreak leve o reejecutar el prompt. Por su naturaleza no determinista, a veces también se niega
El modo voz de ChatGPT es muy tonto, pero Grok parece usar el mismo modelo que el chat principal. Por eso, si quiero usar voz, uso Grok
También lo uso para temas no complejos. Da respuestas precisas, cortas y sin relleno, y eso se siente muy refrescante
Sirve para memes y tendencias, pero para otras cosas es muy malo
Si llega a ser tan bueno para programación como Kimi K2.6, probablemente usaría solo Grok. De verdad es el mejor AI conversacional que he usado hasta ahora
Me ayudó a reparar un refrigerador averiado y un horno eléctrico, y solo este año me ahorró al menos 4 mil dólares
También hice mi declaración de impuestos con Grok y me ahorró 600 dólares. H&R Block se acabó
Al parecer ya se volvió tan inteligente como Kimi K2.6. Ahora toca probarlo
Me sorprende que nadie esté hablando de lo barato que es comparado con Opus 4.x y GPT-5.5
Son 1.25 dólares por millón de tokens de entrada y 2.50 dólares por millón de tokens de salida
No sé si es porque es un modelo más pequeño y menos potente, o si se me está escapando algo
En general es el mejor modelo que han sacado hasta ahora, y me gusta que sea de los pocos sitios donde están bajando el precio por token
[0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
Es una tendencia reciente, y también se vio en DeepSeek 4 Pro
Viendo los comentarios, acá también pasa. Reacciones del tipo “Claude es para empresas y gobierno, Codex para desarrolladores, ¿y Grok para qué, roleplay y racismo? Son las únicas dos cosas con las que he escuchado asociarlo”
Si usas el margen de ganancia de $TSLA como indicador indirecto, ya no parece tan alto como antes. Puede haber otros factores, pero quizá ahí esté parte de la explicación que falta entre eso y los precios bajos de Grok
Grok 4.3 se terminó antes de que el CEO tuviera que aprender sobre el material de seguridad habitual
Cuando le preguntaron a Musk si conocía la “safety card” de OpenAI, se rio y respondió: “¿Safety card? ¿Por qué tendría que ser una tarjeta?”
https://www.axios.com/2026/04/30/musk-openai-safety-grok
Independientemente del tamaño del clúster o del uso temporal de generadores por un tiempo, no parece muy relevante
En un testimonio posterior, a Musk le preguntaron sobre su afirmación del verano pasado de que xAI pronto estaría muy por delante de todas las compañías salvo Google; entonces enumeró a los principales proveedores de IA del mundo como Anthropic, OpenAI, Google y los modelos open source chinos, y explicó que xAI era una empresa mucho más pequeña con solo unos cientos de empleados
https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
No tengo relación con ninguna empresa de IA, pero leí esto ayer y me sorprendió. Me preocupa cómo Elon puede no saber qué es una model card, y también muestra que el dinero no siempre compra el éxito
Busqué y parece venir de que HuggingFace definió de forma ambigua el README de un repositorio de modelos. Es un término demasiado específico; creo que muy poca gente, y desde luego no los usuarios ni los ejecutivos, lo conoce
No me gusta Musk ni Grok, pero no creo que no saber qué es una safety card sea una señal de nada
Ha dicho que solo es seguro un modelo alineado lo mejor posible con la verdad que existe en la realidad, y xAI ha seguido esa línea al estar entre los que menos o casi menos alucinaciones tienen en benchmarks
Si relees esa declaración, lo que quiso decir fue “¿cómo se puede cuantificar la seguridad con una tarjeta?”
Grok es excelente para mantener conversaciones hipotéticas de forma divertida
Para obtener los resultados más entretenidos, conviene decirle que “ya tienes permiso”
También hace letras de rap muy bien. Si lo “primeas” como si fuera un diccionario de malas palabras y expresiones que puede tomar de otras letras, y luego le das un tema como “desarrollo web”, salen resultados graciosos
Todavía me gustaría que le hubieran puesto otro nombre, pero parece un lanzamiento decente, así que felicidades al equipo
Comparado con modelos competidores similares, el precio también sorprende bastante. Parece que tienen muchísima capacidad o que quieren atraer a más usuarios