Notas del Mistral AI Now Summit
(koenvangilst.nl)- Mistral busca posicionarse no solo como una empresa de modelos, sino como una compañía de IA de pila completa que integra cómputo, modelos, plataforma y consultoría
- Destaca su centro de datos de 40 MW en París y sus planes para más centros de datos, diferenciándose con modelos abiertos y personalizados que el cliente puede poseer y ejecutar on-premises
- Más que anunciar nuevos modelos, el foco estuvo en las alianzas; lo central fue la colaboración con ASML, BNP Paribas y Amazon Alexa+, junto con la presentación de Vibe for Work
- En los sistemas de agentes, el harness aporta contexto, persistencia y aprendizaje, mientras que el razonamiento se trata como la clave para la recuperación ante errores y la transparencia
- Los modelos pequeños y especializados, junto con el despliegue on-premises, forman una estrategia orientada a industrias reguladas y empresas europeas, con foco en el retorno de inversión real más que en la carrera por la AGI
Posicionamiento de Mistral
- Mistral se está moviendo en la dirección de construir una pila completa de IA que incluye cómputo, modelos, plataforma y consultoría, en lugar de quedarse solo como una empresa de modelos
- Cuenta con un centro de datos de 40 MW en París y también planea centros de datos adicionales, incluido uno en Suecia
- Su diferencia frente a Anthropic u OpenAI es que ofrece modelos eficientes, abiertos y personalizables que el cliente puede poseer y ejecutar on-premises
- El mensaje del evento puso más peso en las alianzas que en nuevos modelos o innovaciones técnicas
- Las colaboraciones con ASML, BNP Paribas y Amazon Alexa+ se presentaron como ejemplos de resolver problemas reales con IA
- Se presentó Vibe for Work, descrito como un producto similar a Claude for Work
Estrategia de producto y casos de uso
-
Sistemas de agentes y harness
- Los modelos por sí solos no son suficientes, y el harness cumple la función de agregar contexto, persistencia y aprendizaje
- El razonamiento (reasoning) se trata como un elemento clave para que el sistema pueda retroceder, recuperarse de errores y mantener la transparencia
- Las mejores prácticas de una organización se capturan como skills, y evolucionan mientras se trabaja con agentes de IA
-
Modelos pequeños y especializados
- Mistral muestra casos en los que modelos pequeños, rápidos y bien enfocados superan a los grandes modelos de propósito general en eficiencia energética y velocidad
- Document AI es un modelo para OCR, y la EU Patent Office lo usa para OCR a gran escala
- Voxtral es un modelo de voz multilingüe, y se usa para impulsar Amazon Alexa+ en Europa
- Robostral se usa en robótica industrial junto con ASML
- En aplicaciones de tipo agente con alto consumo de tokens, la velocidad y la eficiencia se vuelven tan importantes como el rendimiento puro
-
Soberanía y despliegue on-premises
- BNP Paribas ejecuta modelos de Mistral on-premises en Bélgica para casos de uso de KYC, manteniendo los datos sensibles dentro del banco
- Abanca usa orquestación de agentes para procesar a gran escala información sensible de más de 1 millón de clientes dentro de su app
- Para las empresas europeas en industrias reguladas, esto puede ser una alternativa para reducir la dependencia de los hyperscalers de EE. UU.
-
Aplicación en humanidades
- Un equipo de investigación de la Austrian Academy of Sciences ajustó finamente Codestral, el LLM de programación de Mistral, para leer fragmentos de papiro de miles de años de antigüedad
- Este trabajo ayuda a hacer accesible una colección de 180 mil documentos hallados en el desierto egipcio
- Se presentó como una tarea que habría tomado más de 2,000 años sin IA
- El proyecto Apollo de la Austrian Academy of Sciences muestra un caso en el que la IA también puede contribuir a las humanidades
-
Estrategia europea de socio de IA
- La visión de Mistral parece estar más cerca de convertirse en un socio europeo de IA full-stack que ofrezca retorno de inversión real hoy, que de ganar la carrera por la AGI
- El éxito o fracaso de esta estrategia dependerá de si más empresas europeas adoptan el enfoque de Mistral
- La combinación de modelos abiertos, despliegue on-premises y alianzas empresariales puede resultar atractiva para muchas grandes organizaciones de la UE
- La era de depender ciegamente de las grandes tecnológicas de EE. UU. está llegando a su fin, y lo importante es que ya apareció un actor europeo serio en IA
¿Quieres seguir recibiendo temas de tecnología seleccionados?
Sigue el canal de Telegram. @GeekNewsES
1 comentarios
Comentarios de Hacker News
Realmente apoyo a Mistral y a los modelos pequeños especializados en tareas, pero Mistral se ha quedado demasiado atrás desde el tercer trimestre de 2025
Para competir hoy, necesitas poder correr un buen modelo de razonamiento incluso con una longitud de contexto intermedia, y Mistral no parece poder hacerlo
En este momento, del lado de los modelos pequeños, Gemma4 y Qwen3.6 son los mejores, y el modelo “small” de Mistral tiene 120B, aproximadamente 4 veces más parámetros, y aun así ni siquiera compite bien con modelos que tienen una cuarta parte de su tamaño
Hace un año, con Mistral Small 3.1, todavía iba siguiendo el ritmo, pero ahora prácticamente ha desaparecido del mapa
Si Mistral realmente quiere apuntar en serio al mercado on-premise y al de modelos pequeños especializados en tareas, una buena métrica indirecta podría ser crear un modelo que entusiasme a la gente de r/localLlama
También preocupa que en la conferencia casi no hayan hablado de modelos nuevos. Personalmente, creo que ese debería ser su principal enfoque
Me pregunto qué los está frenando. No sé si es dinero, recursos de cómputo, capacidad o datos de entrenamiento
Para crear un modelo realmente bueno, probablemente hay que entrenar con datos bastante cuestionables, como salidas de modelos frontier, y me preocupa que Mistral sea demasiado europeo y demasiado orientado a clientes empresariales como para asumir ese riesgo
Probablemente acabe como una empresa zombi al estilo Dailymotion
Por ejemplo, pienso en algo como un subconjunto de Opus dedicado solo a software, que fuera el modelo predeterminado en Claude Code
Sería más pequeño, más barato de desplegar y usar, y quizá también más rápido
Para entonces, Mistral debería estar lista, pero viendo sus resultados recientes, la verdad no tengo muchas expectativas
Aunque Mistral 4 tenga 6B de parámetros activos por token y se puedan cargar 3~3.5 parámetros por token en una 4090, unos 240GB de descarga y espacio de almacenamiento ya rozan el límite de lo razonable para probarlo en local
Más aún si estás descargando y evaluando varios modelos, y también se vuelve más difícil que otras personas hagan fine-tuning posteriores, como ocurrió con modelos anteriores de Mistral/Magistral
Escuché la charla de un excelente responsable de TI del gobierno, y estaba evaluando modelos y bastante inconforme con la situación actual
Quiere usar Mistral y, en algunos casos, incluso es el único modelo basado en la UE que puede usar, pero también sabe que su rendimiento es realmente malo y que cada vez se queda más atrás
Puede que Mistral logre construir un negocio rentable simplemente por ser el único modelo viable para ciertos usos dentro de la UE. Es triste, y da pena verlo
De verdad espero que Europa participe en el desarrollo y la investigación en IA, y también apoyé mucho a Mistral
Pero la brecha tecnológica se está acumulando demasiado. Si no logran corregir esto, será otra prueba de que Europa no puede operar grandes tecnológicas con buenos resultados
En la práctica, casi todos los laboratorios chinos lo están haciendo mucho mejor. Sin siquiera hablar de DeepSeek, no fue Mistral quien creó cosas como MiMo 2.5 o Minimax 2.7
Los modelos de Mistral son más débiles, o más grandes y lentos, o simplemente no tienen mezcla de expertos (MoE), así que no salen bien parados
Europa se disparó en el pie con esta ley hecha a las prisas durante el pico de la histeria colectiva, y ahora ninguna empresa sensata va a querer construir algo ahí
En Estados Unidos o China, una startup de IA puede empezar con un chico y una computadora, pero en Europa ese chico necesita doce abogados
Que Mistral, pese a su ventaja inicial, sus modelos tempranos tan prometedores y la inversión recibida, haya perdido presencia, podría ser el resultado de haber intentado cumplir con toda esa regulación
Me impresionó mucho ese informe técnico. Claro, tengo entendido que la idea de MoE en sí ya existía desde antes
Si hubieran seguido empujando la familia Mixtral, quizá hoy tendrían una reputación como la de la línea Qwen. Fue una oportunidad perdida
Comparado con eso, diría que Europa lo está haciendo bastante bien
BNP Paribas está ejecutando modelos de Mistral on-premises para KYC en Bélgica, y lo importante es que los datos sensibles permanecen dentro del banco
Abanca también está usando orquestación de agentes para procesar información sensible de clientes a gran escala, como los 2 millones de clientes de su app
Para las empresas europeas de industrias reguladas, es una mejor alternativa que depender de hyperscalers de EE. UU., y que Mistral se enfoque en modelos on-premises y con hosting en Europa parece una dirección muy inteligente
Todos están haciendo full-deployment engineering o customer-specific engineering, porque si no, simplemente parecen una empresa que le pone margen al costo de los tokens
Entonces las empresas Neo-SaaS se van a llevar el dinero. Si no, ¿quién compraría la IA de Mistral y qué otras opciones habría?
Más bien parece estar enfocándose en otras áreas como modelos multilingües, OCR y voz
Su página de presentación de modelos también lo refleja, pero es tan variada y tiene tantas categorías y nombres de modelos que siempre me confunde
Ojalá sus decisiones den buenos resultados
Para las startups europeas, B2B empresarial siempre me ha parecido un lugar al que uno va a morir
Asistí al evento, y el tamaño de los asistentes fue impresionante; estaban todos los líderes de las principales empresas europeas que cotizan en bolsa
También fue interesante la cantidad de socios invitados. Había de todo, desde Microsoft, Accenture y EY hasta startups como alpic.ai y lingo.dev
Parece que también están reforzando el movimiento del lado de M&A
Dejando el negocio aparte, el diseño del sitio web es realmente excelente: https://mistral.ai/
Me llegó un correo de Mistral diciendo que van a retirar gradualmente para agosto algunos, quizá la mayoría, de sus modelos dedicados como devstral, y que ahora usemos modelos de propósito general
El costo crece de forma exponencial
Dice que recomiendan migrar de Devstral 2(devstral-2512 y devstral-latest) al modelo más potente Mistral Medium 3.5(mistral-medium-3-5, con
reasoning_effortconfigurado en "high"), y el precio es de $1.5/$7.5 por millón de tokens de entrada/salidaAntes era $0.4/$2
De todos modos, después de recibir el correo, quise pensar que era una señal de que van a lanzar modelos nuevos y mejorados en los próximos meses
No parece tener ningún moat. Se siente como una empresa de consultoría de software con data centers
Además, en el texto dicen que muchos clientes usan estos modelos on-premises, así que los data centers tampoco serían una ventaja real
¿Qué impediría que cualquier startup con apoyo del gobierno fine-tunee un pequeño modelo open source?
No digo que eso sea cierto, solo que es una suposición posible
Como europeo, estoy 100 veces de acuerdo
De todos estos jugadores, realmente me gusta la dirección y la transparencia de Mistral
Dicen que Abanca usa orquestación de agentes para procesar información sensible de clientes a una “escala enorme” de 2 millones de clientes de la app, pero no sé si mi criterio de lo que es escala enorme está distorsionado
¿2 millones de usuarios no serían apenas unos cientos de MB de datos? Incluso si hubiera muchos datos por usuario, parecerían apenas unos cuantos GB
Por lo que entendí de la presentación, parece que usaron agentes con responsabilidad limitada y probablemente modelos más pequeños para que las respuestas fueran rápidas, estables y no demasiado costosas
En cambio, ese tipo de negocio puede tener bastante capacidad defensiva, pero por lo general no se traduce en una rentabilidad igual de alta