Lanzamiento beta del nuevo servicio de plataforma de Mistral AI
- Mistral AI ofrece a los desarrolladores modelos generativos abiertos y potentes, junto con formas de desplegarlos y personalizarlos de manera eficiente.
- Hoy comienza el acceso beta a su primer servicio de plataforma, que ofrece tres endpoints de chatbot para generar texto a partir de instrucciones de texto y un endpoint de embeddings.
- Cada endpoint tiene una relación distinta entre rendimiento y precio.
Endpoints de generación
mistral-tinyymistral-smallusan los dos modelos publicados actualmente, mientras quemistral-mediumusa un modelo prototipo que se está probando en entorno de despliegue.- Los modelos integran las técnicas de alineación más efectivas, como ajuste fino eficiente y optimización directa de preferencias, para crear modelos que los usuarios puedan controlar fácilmente y que resulte agradable usar.
Mistral-tinysolo admite inglés,Mistral-smalladmite varios idiomas y código, yMistral-mediumestá evaluado como uno de los modelos de servicio de nivel más alto.
Endpoint de embeddings
Mistral-embedofrece un modelo de embeddings pensado para búsqueda, con una dimensión de embedding de 1024.- Este modelo de embeddings logró una puntuación de recuperación de 55.26 en MTEB.
Especificación de la API
- La API sigue la especificación de la popular interfaz de chatbot propuesta inicialmente por un competidor.
- Ofrece bibliotecas cliente para Python y Javascript con las que se pueden consultar los endpoints.
- Los endpoints permiten proporcionar system prompts para que los usuarios configuren un nivel más alto de moderación sobre la salida del modelo.
De acceso beta a disponibilidad general
- Desde hoy, cualquiera puede registrarse y usar la API, y la capacidad se irá ampliando de forma gradual.
- El equipo de negocios puede ayudar a entender los requisitos y acelerar el acceso.
- Puede haber partes inestables mientras estabilizan la plataforma para que sea completamente autoservicio.
Agradecimientos
- Agradecen a NVIDIA por apoyar la integración de TensorRT-LLM y Triton, y por colaborar en la creación de una mezcla dispersa de expertos compatible con TRT-LLM.
Opinión de GN⁺
- Lo más importante de este artículo es que Mistral AI pone a disposición de los desarrolladores nuevos modelos generativos y de embeddings, lo que les permite usar mejores capacidades de generación de texto y embeddings.
- Estas tecnologías impulsarán el avance de la inteligencia artificial, y la capacidad de admitir varios idiomas y código ampliará enormemente sus posibilidades de aplicación en el mercado global.
- Para los desarrolladores, esto representa una oportunidad emocionante para crear proyectos y soluciones innovadoras mediante nuevas herramientas y APIs, y es una noticia que eleva las expectativas sobre el futuro de la tecnología.
1 comentarios
Opiniones en Hacker News