Resumen clave del modelo MiniMax M2
- Resumen del modelo: El modelo M2 de MiniMax en China (230 mil millones de parámetros, arquitectura de activación selectiva) muestra un rendimiento que supera a Claude Opus 4.1, con un costo equivalente al 8% de Claude Sonnet ($0.30 por 1 millón de tokens de entrada) y una velocidad 2 veces mayor.
- Innovación en eficiencia: Gracias a una arquitectura MoE, activa solo los parámetros necesarios y reduce los costos en 92%, con un desarrollo centrado en casos reales de trabajo (resolución de programación compleja y tareas de agentes).
- Rendimiento en benchmarks: 61 puntos en Intelligence Index (n.º 1 entre modelos open source), 69.4 en SWE-bench, 46.3 en Terminal-Bench y 44 en BrowseComp, acercándose o incluso superando a modelos de Claude y Gemini.
- Aplicación práctica: Destaca en matemáticas, programación y flujos de trabajo con agentes (análisis de datos, investigación de issues y programación), y pruebas de desarrolladores demostraron su capacidad para corregir errores.
- Cómo usarlo: Uso gratuito en el servicio web (https://agent.minimax.io/), integración vía API y descarga recomendada del open source en Hugging Face (licencia MIT; se requiere una configuración específica).
- Significado: Con el auge de los modelos open source, la competencia en IA está cambiando hacia la eficiencia y la utilidad práctica.
3 comentarios
Si fuera 23B (el artículo dice 230B), pensé por un momento que quizá hasta se podría correr en una Mac mini..
Yo también... como decían que 23B estaba al nivel de Claude 4.1 Opus, fui a Hugging Face y me decepcioné al ver que eran 230B.....
No son 23 mil millones, sino 230 mil millones de parámetros.