- Mistral Large es un modelo de generación de texto de última generación, con capacidades de razonamiento de primer nivel.
- Puede realizar tareas complejas de razonamiento en varios idiomas y puede usarse para comprensión de texto, transformación y generación de código.
- Muestra un rendimiento sólido en el benchmark MMLU y es el segundo modelo mejor clasificado entre los generalmente disponibles mediante API en el mundo.
- 81.2%, detrás de GPT-4 con 86.4%; Claude 2 con 78.5% y Gemini Pro con 71.8%
Nuevas funciones y fortalezas de Mistral Large
- Tiene dominio a nivel nativo de inglés, francés, español, alemán e italiano, y ofrece una comprensión sutil de la gramática y del contexto cultural.
- Su ventana de contexto de 32K tokens permite recuperar información con precisión desde documentos extensos.
- Gracias a su capacidad de seguir instrucciones precisas, los desarrolladores pueden diseñar sus propias políticas de moderación, lo que se usa en la configuración de moderación a nivel de sistema de le Chat.
- Incorpora capacidad de llamada de funciones, lo que junto con el modo de salida restringida implementado en la Plateforme permite desarrollar aplicaciones y modernizar stacks tecnológicos a gran escala.
El modelo estará disponible en Azure mediante una alianza con Microsoft
- El objetivo de Mistral es democratizar la IA líder, y para ello ofrece modelos abiertos y comerciales en Azure.
- Los modelos de Mistral pueden usarse a través de La Plateforme y Azure, y también pueden desplegarse directamente en el entorno del usuario.
- La Plateforme está alojada de forma segura en la infraestructura europea de Mistral, mientras que Azure lo ofrece a través de Azure AI Studio y Azure Machine Learning.
- El despliegue propio permite acceder a los pesos del modelo para los casos de uso más sensibles, y se puede leer casos de éxito y contactar al equipo para obtener más información.
Capacidades de Mistral Large
- Mistral Large muestra fuertes capacidades de razonamiento frente a los principales modelos LLM en benchmarks estándar.
- En capacidad multilingüe, Mistral Large también supera ampliamente a LLaMA 2 70B en francés, alemán, español e italiano.
- También muestra un rendimiento de primer nivel en tareas de código y matemáticas.
Nuevo Mistral Small, optimizado para cargas de trabajo de baja latencia
- Junto con Mistral Large, se lanza Mistral Small, un nuevo modelo optimizado para latencia y costo.
- Mistral Small ofrece mejor rendimiento y menor latencia que Mixtral 8x7B, y es una solución intermedia refinada entre la oferta de open-weights y los modelos insignia.
- Mistral Small aprovecha las mismas innovaciones de activación RAG y llamada de funciones que Mistral Large.
- Ofrece endpoints open-weights con precios competitivos y nuevos endpoints de modelos optimizados, dando una visión integral del trade-off entre rendimiento y costo.
Formato JSON y llamada de funciones
- El modo de formato JSON obliga a que la salida del modelo de lenguaje sea JSON válido.
- Mediante la llamada de funciones, los desarrolladores pueden conectar sus propias herramientas con los endpoints de Mistral para permitir interacciones más complejas con código interno, API o bases de datos.
- La llamada de funciones y el formato JSON solo están disponibles en mistral-small y mistral-large, y pronto planean agregar especificación de formato para todos los endpoints.
Opinión de GN⁺
- Mistral Large es un modelo de lenguaje de IA con soporte multilingüe y capacidades avanzadas de razonamiento; destaca especialmente su habilidad para realizar tareas complejas en varios idiomas.
- Este modelo tiene el potencial de competir con modelos existentes como GPT-4, y en particular su soporte para varios idiomas aumenta su aplicabilidad en el mercado global.
- La alianza con Azure ofrece una oportunidad para que los modelos de Mistral AI lleguen a una base de usuarios más amplia, y refuerza la escalabilidad y accesibilidad de los servicios de IA en la nube.
- El lanzamiento de modelos optimizados como Mistral Small puede ser una opción atractiva para empresas que necesitan soluciones de IA rentables y de baja latencia.
- Las funciones de formato JSON y llamada de funciones facilitan que los desarrolladores integren los modelos de IA en sus aplicaciones, aumentando la practicidad y flexibilidad de la tecnología de IA.
1 comentarios
Opiniones en Hacker News
Se valora mucho la franqueza del material de marketing. Mostrar puntajes de benchmark por debajo del producto líder del mercado parece mejor que lo que hace Google al usar benchmarks de forma selectiva.
Ya han hecho muchas cosas, pero habría sido bueno que reafirmaran su promesa de contribuir a la comunidad open source. Pensaba que eso era una parte importante de su marca.
Después del caso de miqu, estuve esperando que salieran más open weights, pero parece que habrá que ver qué pasa.
Actualización de cambios: cambio de nombre de endpoints de API y adición de endpoints de modelos, lanzamiento de nuevos modelos, actualizaciones de modelos existentes y aviso de futura descontinuación.
Nuevas funciones de API: ahora se puede usar function calling y modo JSON en los modelos Mistral Small y Mistral Large.
La Plateforme: se añadió un sistema de pagos con soporte para múltiples monedas y se incorporaron funciones de plataforma empresarial.
Le Chat: lanzamiento de una nueva interfaz de chat para interactuar fácilmente con los modelos de Mistral.
Se añadió el nuevo modelo al plugin para la herramienta LLM CLI. Ahora se puede usar así.
Probé Le Chat para resolver algunos problemas de programación que tuve hoy, y dio respuestas mucho mejores que ChatGPT (incluido GPT-4). No estoy seguro de si la calidad de ChatGPT realmente ha bajado para reducir costos, como sugieren algunas personas, pero para estos problemas puntuales la calidad de las respuestas de Mistral fue muy superior.
No sabía que existía Le Chat. Quería un competidor de ChatGPT basado en Mistral, y además me gusta que le hayan puesto "le" al inicio del nombre del producto.
En Azure, Mistral es ligeramente más barato que GPT-4.
Me pregunto si todo el ruido alrededor de los open weights ya terminó y si esto seguirá siendo cerrado.
No veo información sobre el tamaño de los parámetros en ninguna parte; pregunto si eso es intencional o si se me pasó.
Es como si existieran varias arquitecturas de CPU intercambiables. Cada vez que sale un nuevo LLM, da la sensación de que el monopolio se reduce mucho más y de que la situación va a mejorar. Incluso sin modelos open source, parece que OpenAI ya cumplió su misión.