Debuta MiniMax-M3: supera a GPT-5.5 y Gemini 3.1 Pro en benchmarks clave con apenas 5-10% del costo
(venturebeat.com)La startup china de IA MiniMax lanzó de forma sorpresiva 'M3', un modelo multimodal de lenguaje de gran escala basado en pesos abiertos que supera a GPT-5.5 y Gemini 3.1 Pro con un costo rompedor de apenas 5 a 10% frente a los modelos comerciales existentes de EE. UU.
Traducción completa
La startup china de IA MiniMax lanzó de forma sorpresiva 'M3', un modelo multimodal de lenguaje de gran escala con rendimiento de codificación de nivel frontier y una ventana de contexto de 1 millón de tokens, sacudiendo con fuerza el mercado global de IA empresarial. M3 se distribuirá dentro de los próximos 10 días a través de Hugging Face y GitHub bajo una licencia open source de 'pesos abiertos (Open Weights)', para que las empresas puedan descargarlo localmente en sus propios servidores y hacer optimizaciones personalizadas. Por ahora se ofrece con precio de lanzamiento de 0.30 dólares por cada millón de tokens de entrada y 1.20 dólares por tokens de salida (costo total de 1.50 dólares ), y aun cuando entre en vigor el precio normal, seguirá costando apenas entre 8 y 20% {p:14} de los principales modelos comerciales de EE. UU., superando ampliamente en costos a gigantes tecnológicos estadounidenses como Google, OpenAI y Anthropic.
La clave principal de esta reducción drástica de costos es la arquitectura 'MiniMax Sparse Attention (MSA)', que resuelve el problema de explosión del costo computacional cuadrático de los transformers tradicionales. La tecnología MSA divide los datos en bloques de alta precisión y empareja dinámicamente solo las consultas necesarias, maximizando así la eficiencia del hardware; al procesar 1 millón de tokens, reduce los requisitos de cómputo a apenas una vigésima parte de lo convencional {p:5} y eleva la velocidad de decodificación hasta 15 veces. Con base en esta innovación estructural, M3 registró 59.0% {p:59} en SWE-Bench Pro, que evalúa la capacidad de realizar ingeniería de software autónoma, superando a modelos cerrados como GPT-5.5 y Gemini 3.1 Pro, y también rebasó el récord previo de Claude Ops 4.7 en rendimiento de navegación web y búsqueda de información (BrowseComp 83.5% {p:84}).
En comparación con Claude Ops 4.8, el modelo cerrado de mayor rendimiento lanzado recientemente (SWE-Bench Pro 69.2% ), todavía existe cierta diferencia en áreas de razonamiento de ultra alta dificultad, pero M3 ofrece una referencia poderosa para automatización local sin necesidad de pagar enormes suscripciones de API. Además, MiniMax presentó junto con M3 la familia de agentes 'MiniMax Code', capaz de escribir código por sí mismo, ejecutar bucles de verificación independientes y corregirse de forma autónoma, e introdujo una tarifa agresiva que empieza desde 20 dólares al mes (Plus). En entornos empresariales donde la privacidad estricta de los datos y el cumplimiento normativo son imprescindibles, se espera que la disponibilidad de M3 con pesos abiertos bloquee de raíz el riesgo de fuga de datos en la nube y ofrezca la mejor relación costo-beneficio para internalizarlo como un activo estratégico propio de la empresa
Comentario breve del autor
Tendré que probarlo en la nube de ollama
2 comentarios
Quizás el criterio para decir que está a la par del modelo es un poco exagerado, pero el precio sí está impactante.
La estoy usando ahora y, a diferencia de otros modelos chinos, no tiene el problema de que de repente empiece a salir chino mientras escribes; además, parece que también hace bien las llamadas a herramientas.