- Magistral es el primer modelo de razonamiento de Mistral AI, especializado en dominios específicos, transparencia y razonamiento multilingüe
- Se lanza en dos versiones: Magistral Small (24B parámetros), de código abierto, y Magistral Medium, versión enterprise para empresas
- Ofrece razonamiento multilingüe basado en Chain of Thought (cadena de pensamiento), mostrando de forma transparente el proceso lógico paso a paso en el idioma del usuario
- En AIME2024, Magistral Medium mostró un rendimiento de 73.6% (máximo de 90%), y Small de 70.7% (máximo de 83.3%)
- Soporta desarrollo lógico preciso paso a paso y velocidad de respuesta 10 veces mayor para distintos idiomas e industrias como legal, finanzas, salud, ingeniería de datos, desarrollo de software y contenido creativo
Magistral — Mistral AI presenta su primer modelo de razonamiento
- Magistral es un modelo de razonamiento centrado en la capacidad de resolver problemas reales y la mejora basada en retroalimentación
- Magistral Small es la versión open source de 24B parámetros y Magistral Medium es una versión enterprise más potente; ambas se lanzan en paralelo
- Métricas de rendimiento:
- Magistral Medium: 73.6% en AIME2024, alcanzando 90% con criterio de voto mayoritario
- Magistral Small: 70.7% y 83.3%, respectivamente
- Aplica razonamiento Chain of Thought basado en idiomas y sistemas de escritura globales, lo que permite desarrollar ideas con nivel de lengua materna
- Es adecuado para tareas como cálculo estructurado, lógica de programación, árboles de decisión y sistemas basados en reglas
- Con las funciones Think mode y Flash Answers de Le Chat, mejora la velocidad de respuesta hasta 10 veces frente a competidores
- El paper oficial incluye una evaluación integral de algoritmos, infraestructura de entrenamiento, técnicas de aprendizaje por refuerzo e insights de entrenamiento
Detalles del modelo y la tecnología
- Proceso de razonamiento transparente:
- Magistral está optimizado para la lógica de múltiples pasos, permitiendo que el usuario revise y siga el proceso de razonamiento en su propio idioma
- A diferencia de modelos generales, refuerza la interpretabilidad y las capacidades de validación
- Busca actualizaciones continuas del modelo y mejoras rápidas
- Razonamiento multilingüe: alta precisión y consistencia lógica en inglés, francés, español, alemán, italiano, árabe, ruso, chino y otros idiomas
- Velocidad de respuesta:
- Magistral Medium, mediante la función Flash Answers de Le Chat, soporta razonamiento y retroalimentación en tiempo real con una velocidad de procesamiento de tokens 10 veces mayor que la competencia
- Demuestra un desempeño sobresaliente en velocidad frente a modelos competidores principales como ChatGPT
Código abierto y participación de la comunidad
- Magistral Small se publica bajo licencia Apache 2.0
- Los usuarios pueden analizar, modificar y reconfigurar directamente su estructura y método de razonamiento
- Modelos open source anteriores se utilizaron en proyectos de investigación innovadores como ether0 y DeepHermes 3
Casos de uso amplios
- Magistral está optimizado para áreas donde el razonamiento preciso paso a paso y la transparencia son clave, como legal, finanzas, desarrollo de software y storytelling
-
Estrategia y operaciones de negocio
- Puede realizar planificación estratégica, evaluación de riesgos, toma de decisiones basada en datos y cálculo de soluciones óptimas bajo restricciones complejas
-
Industrias reguladas y sector público
- Profesionales de legal, finanzas, salud y gobierno pueden rastrear la ruta de razonamiento lógico y asegurar auditabilidad
- Ayuda a cumplir con auditabilidad de resultados y cumplimiento normativo
-
Sistemas, software e ingeniería de datos
- Mejora la calidad del soporte en programación, diseño de proyectos, arquitectura backend e ingeniería de datos frente a LLM sin razonamiento
- Es eficaz para tareas de múltiples pasos como integración con herramientas externas y APIs
-
Generación de contenido y comunicación
- Magistral también muestra resultados destacados en escritura creativa y storytelling
- Puede generar no solo texto coherente, sino también ideas originales e ingeniosas
Cómo usarlo y vías de despliegue
- La versión Small puede descargarse y desplegarse por cuenta propia
- La versión Medium puede usarse de inmediato en Le Chat (web), API y Amazon SageMaker
- Próximamente tendrá soporte adicional en IBM WatsonX, Azure AI y Google Cloud Marketplace
- La implementación on-premise y personalizada para empresas se gestiona por separado
1 comentarios
Comentarios de Hacker News
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XL, y en llama.cpp recomiendan usar sí o sí opciones como--jinja,--temp 0.7,--top-p 0.95. También sugieren aumentar la longitud de contexto de Ollama a más de 8192, y hay más guía disponible en la documentación oficialjinja