xAI presenta Grok 4.3

(docs.x.ai)

5 puntos por GN⁺ 2026-05-02 | 1 comentarios | Compartir por WhatsApp

Ofrece una ventana de contexto de 1 millón de tokens y funciones de API orientadas a desarrolladores como razonamiento, llamadas a funciones y salidas estructuradas
A diferencia de Grok 4.20 anterior, el razonamiento está siempre activado, realizando automáticamente un proceso de pensamiento antes de responder a todas las consultas
Reducción de aproximadamente 40% en el precio de los tokens de entrada y de aproximadamente 60% en los tokens de salida, lo que reduce de forma significativa los costos frente al modelo anterior
- Precios: entrada $1.25/1M tokens, entrada en caché $0.20/1M, salida $2.50/1M
- Se ubica entre los modelos más baratos de su nivel de inteligencia
Gran mejora en el rendimiento para tareas agenticas — registró una puntuación ELO de 1500 en el benchmark GDPval-AA, subiendo 321 puntos frente a Grok 4.20 y superando a Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini y otros
Primer modelo de la API de xAI con soporte de entrada de video nativa, procesando directamente cuadros de video mediante un codificador de visión
Alcanzó el primer lugar en razonamiento legal (79.3% de precisión en CaseLaw v2) y el primer lugar en finanzas corporativas (CorpFin), con un salto de 25 puntos en razonamiento legal frente a Grok 4.20
En la interfaz de chat permite generar directamente diapositivas de presentaciones, así como crear y descargar en tiempo real archivos PDF, Excel y PowerPoint durante la conversación
Incluye un entorno integrado de ejecución de código, permitiendo que el modelo maneje la escritura, ejecución y generación de archivos
También se lanzan oficialmente la API de Speech-to-Text (25 idiomas, con soporte para separación de hablantes) y la API de Text-to-Speech
Con una puntuación de 53 en el Artificial Analysis Intelligence Index, supera a Muse Spark y Claude Sonnet 4.6, y se sitúa en la frontera de Pareto de inteligencia por costo
Límite de tasa de 1,800 solicitudes por minuto / 10 millones de tokens, con cobro adicional por encima de 200K
El nombre del modelo es grok-4.3 y las regiones compatibles son us-east-1 y eu-west-1

1 comentarios

GN⁺ 2026-05-02

Comentarios de Hacker News

Como alguien que tiene el inglés como segundo idioma, Grok destaca especialmente para captar y reproducir el tono y el nivel de formalidad de un texto
Parece entender mejor los matices humanos sutiles del lenguaje que otros proveedores importantes, y ChatGPT suele volverse demasiado rígido y formal o caer en un informal raro tipo “aye guvnor”. Claude a veces es mejor, pero no siempre
En general, Grok se siente más “humano” de una forma difícil de definir. Por ejemplo, si le preguntas “¿este mensaje comunica más o menos bien la idea dentro de este largo?”, responde como una persona con un sí/no o con sugerencias de edición manteniendo el tono y la longitud, mientras que ChatGPT todavía termina escribiendo un ensayo largo y poco claro
Últimamente también siento que el dictado por voz de Grok está bastante bien. En la función de presionar el micrófono para preguntar, ChatGPT acierta un 90~95% con mi acento, la entrada por voz de Android Gboard anda por el 75%, pero Grok sorprendentemente llega como al 98%
- Hice una evaluación rápida de Grok 4.3, Opus 4.7 y GPT 4.1, y en la práctica se veían bastante parecidos: https://ofw640g9re.evvl.io/
  Los tres manejaban bien un tono más formal, pero en tono casual el único que no daba vergüenza ajena era GPT-4.1
  Por cierto, Grok fue el más rápido y barato, y Claude el más lento y caro
- Incluso al hablar con Grok en mi idioma nativo, siento que el tono es más natural que en otros modelos
  Creo que es una ventaja de haber sido entrenado mucho con datos de Twitter. Aunque me preocupa que, como cada vez hay más contenido generado por IA en Twitter, si siguen entrenándolo ahí esa naturalidad pueda empeorar
- Solo uso Grok a través de la personalidad “Gork” de Tesla, y las respuestas son bastante realistas, a menudo realmente graciosas y a veces incluso útiles
- Si “tienes el inglés como segundo idioma”, me da curiosidad cómo sabes que realmente es mejor
  No lo digo de forma despectiva, pero esto parece más una impresión
- Un amigo lo usa para preparar D&D, y me dijo que para eso es especialmente bueno por su capacidad para ajustarse al ambiente y estilo que uno quiere
  Para otras cosas sigue prefiriendo ChatGPT
Grok es mi modelo favorito para chatear, y también el que más me gusta en modo voz
Parece ser el único modo voz que no te redirige a un modelo extremadamente barato, como Haiku, y dentro de los de nivel frontier fue el de mayor calidad
Si te suscribes a SuperGrok, puedes crear un “council” de agentes, cada uno con su propio system prompt, y cuando preguntas algo se lo consulta a todos en paralelo antes de sacar una conclusión
Eso sí, ojalá invirtieran un poco en la app. De hecho, la única razón por la que no termino suscribiéndome a SuperGrok es la app
No hay soporte para MCP/apps conectadas, y aunque lo anunciaron, todavía no se puede usar. No puedes conectar Grok con nada, así que cuesta usarlo para trabajo serio
Los proyectos todavía no están soportados en la app, así que en cuanto mueves algo a un proyecto, desaparece de todas las apps nativas
No hay forma de agregar directamente al proyecto artefactos como documentos Markdown generados, así que tienes que exportarlos a PDF/Markdown y volver a importarlos. Ni siquiera existe exportación de artefactos. Es difícil hacer evolucionar dinámicamente un proyecto con nueva información, así que resulta incómodo para trabajo serio en proyectos
Tampoco hay memoria ni forma de revisar otros chats, así que cada conversación empieza completamente desde cero
Dentro de los proyectos tampoco existe modo voz
Si alguien de xAI está leyendo esto, sería bueno que agregaran хотя бы algunas de estas cosas
- Cada vez me empieza a gustar más que no tenga memoria
  Claude recuerda que tengo una parrilla, así que incluso en conversaciones totalmente irrelevantes o que solo son sobre comida, mete que eso podría ir bien con BBQ
- El modo voz de la app de Gemini usa un modelo relativamente reciente, no uno pequeño y degradado, así que es bastante competente
  Su personalidad también está bien y se siente mucho más natural que el chat web de Gemini. Mi única queja es que siempre intenta sugerir “siguientes pasos”, aunque parece que todos estos modelos hacen eso
  No sé si esos “siguientes pasos” son una forma de subir costos o si todavía no han aprendido el patrón natural de conversación para distinguir entre preguntas que solo requieren una respuesta corta y conversaciones largas de exploración. Igual, si uno les pide que no hagan eso, deberían obedecer
- Creo que Grok ganaría mucho si el plan de 300 dólares al mes llamado “SuperGrok Heavy” permitiera usar su cuota incluida en harnesses de coding
  Ahora mismo el plan Heavy te da algo de crédito API, así que se puede usar Grok un poco para programar, pero no parece que valga 300 dólares
  No digo que hagan su propio harness grok-code; con que pudiera usarse desde herramientas ya existentes sería útil. Probablemente la compra de Cursor termine apuntando a algo así
- Creo que todos los problemas que mencionaste son la razón detrás del acuerdo con Cursor
- No me queda claro si al suscribirte a SuperGrok puedes usarlo en Pi agent o en Opencode
  No está claro si SuperGrok te da una API key
En nuestras pruebas, Grok 4.3 es un modelo peculiar
Es de los más rápidos, y frente a otros modelos de rendimiento similar da respuestas mucho más cortas y con mayor densidad de tokens
Pero su capacidad general de razonamiento para código no compite con los grandes lanzamientos de abril, y ni Grok 4.20 ni Grok 4.3 lograron empujar mucho el frente de inteligencia desde Grok 4
Grok 4.3 sí es mejor en tareas de tipo agente, y sería justo decir que está más o menos al nivel de GPT 5.1 / Gemini 3 Pro Preview, pero siendo mucho más rápido y barato. Así que, dentro de lo suyo, sin duda es un buen lanzamiento
Entre los modelos de pesos abiertos publicados recientemente hay varios más inteligentes, aunque más lentos
El benchmark completo está en https://gertlabs.com/rankings
- Me pregunto si hubo algún tipo de compensación para hacer que pareciera funcionar bien con información posterior al knowledge cutoff
  Ese parece ser el principal caso de uso de Grok, y también me pregunto si existe algún benchmark sobre eso
Últimamente Grok se ha convertido en mi motor de búsqueda
Parece ser la única IA con acceso a publicaciones de X, y aparte de eso en general da más la impresión de “estar buscando” que otros modelos de lenguaje grandes
- Para buscar noticias sobre eventos de último momento, uso sobre todo Grok y Gemini
  Durante los incidentes relacionados con Irán quería enterarme de la situación apenas se iba reportando, y ambos funcionaron bastante bien
- Me pregunto por qué querrías buscar en Twitter en primer lugar
Viendo el panorama actual, Claude parece ser para empresas y gobierno, Codex para desarrolladores, y no sé para qué sería Grok
Lo único con lo que he escuchado asociar a Grok es roleplay y racismo
- Curiosamente, conozco un caso de una organización benéfica que trabaja con trata de personas y usa Grok
  Grok hizo sin problema una tarea puntual de clasificación que todos los demás modelos rechazaron
  Creo que para un modelo casi-frontier con menos guardrails hay sorprendentemente muchos usos reales útiles en zonas grises. El modelo grok-fast además es barato
- Por lo que he visto, Grok no se usa tanto para roleplay
  Se le considera inconsistente y caótico
  La gente suele usar GLM y DeepSeek por API, y en local modelos fine-tuned de Gemma4 y Mistral
  El mercado del roleplay es relativamente antiguo y maduro, así que los usuarios parecen ser conscientes del costo y quieren que el modelo se adapte a su flujo de trabajo y preferencias. Por eso cosas como Opus gustan por inteligentes, pero se consideran demasiado caras y tercas
  Puede ser un dato interesante para ver cómo evolucionarán otros mercados en el futuro
- Si necesitas preguntar de qué está hablando la gente en Twitter, Grok obviamente es muy bueno
  Siempre lo uso para preguntas como “¿cuál es el tiling window manager que la gente cool de Twitter dice que es el mejor últimamente?”
  También Grok suele responder preguntas medio sospechosas o ambiguas. Algo como “encuéntrame un sitio gray-market para licencias de Windows”
- Entiendo que es muy importante mostrar en la escritura y en el habla señales de alineación con los valores de la época, pero no creo que el objetivo de los laboratorios de IA deba ser hacer que un modelo de lenguaje sea estructuralmente incapaz de incomodar a ciertos grupos raciales/étnicos/castas
  Un modelo de lenguaje es solo un sistema, y tampoco veo muy claro por qué debería ser responsable de cómo el usuario use sus resultados. Es como decir que un bolígrafo es una herramienta “racista” e inútil porque alguien podría escribir cosas horribles en la pared de un baño
  Probablemente vives en un lugar donde el acoso es delito, y quizás también hay normas sobre expresión. ¿No debería bastar con eso? Me pregunto por qué todos los esfuerzos de toda la gente del planeta deberían alinearse con modas éticas que cambian cada pocos años
- Hace 2~3 meses hubo una mesa redonda de IA en la portada de HN, y alguien hizo un análisis de outliers y lo subió a GitHub
  Solo hay que adivinar qué modelo de lenguaje grande fue el mayor outlier y en qué tipo de preguntas difería de todos los demás
Me da curiosidad genuina si la gente realmente usa Grok para algo más que entender memes o tuits de Twitter
- Sí, para algunas tareas es de verdad útil
  No actúa tanto como un guardián como otros modelos. Busco mucho material descatalogado con copyright huérfano desde hace décadas, y los modelos principales se niegan mientras te sermonean por intentar encontrar material con copyright. Grok sí lo hace [0]
  [0] A veces hay que hacerle un jailbreak leve o reejecutar el prompt. Por su naturaleza no determinista, a veces también se niega
- Claro. Los usuarios lo usan para todo tipo de cosas: https://arstechnica.com/tech-policy/2026/03/elon-musks-xai-s...
- Grok tiene el modo voz más útil
  El modo voz de ChatGPT es muy tonto, pero Grok parece usar el mismo modelo que el chat principal. Por eso, si quiero usar voz, uso Grok
  También lo uso para temas no complejos. Da respuestas precisas, cortas y sin relleno, y eso se siente muy refrescante
- Me pregunto cuánto de eso viene de los datos de entrenamiento de Twitter
  Sirve para memes y tendencias, pero para otras cosas es muy malo
- Uso Grok principalmente para búsquedas, DIY, finanzas personales e IA para la vida diaria en general
  Si llega a ser tan bueno para programación como Kimi K2.6, probablemente usaría solo Grok. De verdad es el mejor AI conversacional que he usado hasta ahora
  Me ayudó a reparar un refrigerador averiado y un horno eléctrico, y solo este año me ahorró al menos 4 mil dólares
  También hice mi declaración de impuestos con Grok y me ahorró 600 dólares. H&R Block se acabó
  Al parecer ya se volvió tan inteligente como Kimi K2.6. Ahora toca probarlo
Me sorprende que nadie esté hablando de lo barato que es comparado con Opus 4.x y GPT-5.5
Son 1.25 dólares por millón de tokens de entrada y 2.50 dólares por millón de tokens de salida
No sé si es porque es un modelo más pequeño y menos potente, o si se me está escapando algo
- El precio por token es más barato, pero parece razonar mucho más, así que el costo termina siendo parecido al de 4.20 y el rendimiento es mejor
  En general es el mejor modelo que han sacado hasta ahora, y me gusta que sea de los pocos sitios donde están bajando el precio por token
  [0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
- Bajaron el costo de salida, pero el de entrada sigue siendo relativamente alto
  Es una tendencia reciente, y también se vio en DeepSeek 4 Pro
- Entre mis compañeros de trabajo hay un fuerte rechazo moral a cualquier cosa relacionada con Elon Musk y los datos de entrenamiento
  Viendo los comentarios, acá también pasa. Reacciones del tipo “Claude es para empresas y gobierno, Codex para desarrolladores, ¿y Grok para qué, roleplay y racismo? Son las únicas dos cosas con las que he escuchado asociarlo”
- Sí, es porque es un modelo mucho menos potente
- Grok está vinculado a Elon Musk
  Si usas el margen de ganancia de $TSLA como indicador indirecto, ya no parece tan alto como antes. Puede haber otros factores, pero quizá ahí esté parte de la explicación que falta entre eso y los precios bajos de Grok
Grok 4.3 se terminó antes de que el CEO tuviera que aprender sobre el material de seguridad habitual
Cuando le preguntaron a Musk si conocía la “safety card” de OpenAI, se rio y respondió: “¿Safety card? ¿Por qué tendría que ser una tarjeta?”
https://www.axios.com/2026/04/30/musk-openai-safety-grok
Independientemente del tamaño del clúster o del uso temporal de generadores por un tiempo, no parece muy relevante
En un testimonio posterior, a Musk le preguntaron sobre su afirmación del verano pasado de que xAI pronto estaría muy por delante de todas las compañías salvo Google; entonces enumeró a los principales proveedores de IA del mundo como Anthropic, OpenAI, Google y los modelos open source chinos, y explicó que xAI era una empresa mucho más pequeña con solo unos cientos de empleados
https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
No tengo relación con ninguna empresa de IA, pero leí esto ayer y me sorprendió. Me preocupa cómo Elon puede no saber qué es una model card, y también muestra que el dinero no siempre compra el éxito
- Hablando en serio, sí me pregunto por qué se les dice model “card” y safety “card”
  Busqué y parece venir de que HuggingFace definió de forma ambigua el README de un repositorio de modelos. Es un término demasiado específico; creo que muy poca gente, y desde luego no los usuarios ni los ejecutivos, lo conoce
  No me gusta Musk ni Grok, pero no creo que no saber qué es una safety card sea una señal de nada
- Elon ha dicho públicamente que se toma la seguridad muy en serio
  Ha dicho que solo es seguro un modelo alineado lo mejor posible con la verdad que existe en la realidad, y xAI ha seguido esa línea al estar entre los que menos o casi menos alucinaciones tienen en benchmarks
  Si relees esa declaración, lo que quiso decir fue “¿cómo se puede cuantificar la seguridad con una tarjeta?”
Grok es excelente para mantener conversaciones hipotéticas de forma divertida
Para obtener los resultados más entretenidos, conviene decirle que “ya tienes permiso”
También hace letras de rap muy bien. Si lo “primeas” como si fuera un diccionario de malas palabras y expresiones que puede tomar de otras letras, y luego le das un tema como “desarrollo web”, salen resultados graciosos
Todavía me gustaría que le hubieran puesto otro nombre, pero parece un lanzamiento decente, así que felicidades al equipo
Comparado con modelos competidores similares, el precio también sorprende bastante. Parece que tienen muchísima capacidad o que quieren atraer a más usuarios
- Me pregunto si te molestan en general las referencias de ciencia ficción, o si es Heinlein en particular el que no te gusta

xAI presenta Grok 4.3

Lecturas relacionadas

1 comentarios

Comentarios de Hacker News