Debuta MiniMax-M3: supera a GPT-5.5 y Gemini 3.1 Pro en benchmarks clave con apenas 5-10% del costo
(venturebeat.com)La startup china de IA MiniMax lanzó de forma sorpresiva 'M3', un modelo multimodal de lenguaje de gran escala basado en pesos abiertos que supera a GPT-5.5 y Gemini 3.1 Pro con un costo rompedor de apenas 5 a 10% frente a los modelos comerciales existentes de EE. UU.
Traducción completa
La startup china de IA MiniMax lanzó de forma sorpresiva 'M3', un modelo multimodal de lenguaje de gran escala con rendimiento de codificación de nivel frontier y una ventana de contexto de 1 millón de tokens, sacudiendo con fuerza el mercado global de IA empresarial. M3 se distribuirá dentro de los próximos 10 días a través de Hugging Face y GitHub bajo una licencia open source de 'pesos abiertos (Open Weights)', para que las empresas puedan descargarlo localmente en sus propios servidores y hacer optimizaciones personalizadas. Por ahora se ofrece con precio de lanzamiento de 0.30 dólares por cada millón de tokens de entrada y 1.20 dólares por tokens de salida (costo total de 1.50 dólares ), y aun cuando entre en vigor el precio normal, seguirá costando apenas entre 8 y 20% {p:14} de los principales modelos comerciales de EE. UU., superando ampliamente en costos a gigantes tecnológicos estadounidenses como Google, OpenAI y Anthropic.
La clave principal de esta reducción drástica de costos es la arquitectura 'MiniMax Sparse Attention (MSA)', que resuelve el problema de explosión del costo computacional cuadrático de los transformers tradicionales. La tecnología MSA divide los datos en bloques de alta precisión y empareja dinámicamente solo las consultas necesarias, maximizando así la eficiencia del hardware; al procesar 1 millón de tokens, reduce los requisitos de cómputo a apenas una vigésima parte de lo convencional {p:5} y eleva la velocidad de decodificación hasta 15 veces. Con base en esta innovación estructural, M3 registró 59.0% {p:59} en SWE-Bench Pro, que evalúa la capacidad de realizar ingeniería de software autónoma, superando a modelos cerrados como GPT-5.5 y Gemini 3.1 Pro, y también rebasó el récord previo de Claude Ops 4.7 en rendimiento de navegación web y búsqueda de información (BrowseComp 83.5% {p:84}).
En comparación con Claude Ops 4.8, el modelo cerrado de mayor rendimiento lanzado recientemente (SWE-Bench Pro 69.2% ), todavía existe cierta diferencia en áreas de razonamiento de ultra alta dificultad, pero M3 ofrece una referencia poderosa para automatización local sin necesidad de pagar enormes suscripciones de API. Además, MiniMax presentó junto con M3 la familia de agentes 'MiniMax Code', capaz de escribir código por sí mismo, ejecutar bucles de verificación independientes y corregirse de forma autónoma, e introdujo una tarifa agresiva que empieza desde 20 dólares al mes (Plus). En entornos empresariales donde la privacidad estricta de los datos y el cumplimiento normativo son imprescindibles, se espera que la disponibilidad de M3 con pesos abiertos bloquee de raíz el riesgo de fuga de datos en la nube y ofrezca la mejor relación costo-beneficio para internalizarlo como un activo estratégico propio de la empresa
Comentario breve del autor
Tendré que probarlo en la nube de ollama
6 comentarios
Estoy usando el modelo por suscripción de minimax, y por 100 dólares al año... se puede usar más que de sobra. Incluso ahí también es posible producir hasta 100 canciones al día. (Aunque a veces salen canciones estilo country hechas en chino de forma absurda...)
Parece como una versión menor de suno o flow, y creo que está bien para hacer música de fondo.
No lo he usado para programación ni para temas de agentes, pero tendré que probarlo y compararlo con las API de gemini / open ai / anthropic.
Como es un modelo chino, usarlo vía API no me convence; estaría bien poder ejecutarlo en local.
La estoy usando ahora y, a diferencia de otros modelos chinos, no tiene el problema de que de repente empiece a salir chino mientras escribes; además, parece que también hace bien las llamadas a herramientas.
¿Cómo es que sale con un precio de nivel GPT nano...?
A menos que seas de los que suben su propio documento nacional de identidad al usar IA, no parece que haya mucho problema en usar algo chino.
Como es un modelo chino, todavía me da un poco de reparo usarlo, pero también me hace pensar cuánto habrían subido los precios de los servicios de las empresas estadounidenses si no existieran este tipo de servicios chinos. Incluso me hace sospechar si no tendrá alguna relación con que Trump haya sacado ese tipo de políticas.
Quizás el criterio para decir que está a la par del modelo es un poco exagerado, pero el precio sí está impactante.