1 puntos por GN⁺ 5 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Mistral busca posicionarse no solo como una empresa de modelos, sino como una compañía de IA de pila completa que integra cómputo, modelos, plataforma y consultoría
  • Destaca su centro de datos de 40 MW en París y sus planes para más centros de datos, diferenciándose con modelos abiertos y personalizados que el cliente puede poseer y ejecutar on-premises
  • Más que anunciar nuevos modelos, el foco estuvo en las alianzas; lo central fue la colaboración con ASML, BNP Paribas y Amazon Alexa+, junto con la presentación de Vibe for Work
  • En los sistemas de agentes, el harness aporta contexto, persistencia y aprendizaje, mientras que el razonamiento se trata como la clave para la recuperación ante errores y la transparencia
  • Los modelos pequeños y especializados, junto con el despliegue on-premises, forman una estrategia orientada a industrias reguladas y empresas europeas, con foco en el retorno de inversión real más que en la carrera por la AGI

Posicionamiento de Mistral

  • Mistral se está moviendo en la dirección de construir una pila completa de IA que incluye cómputo, modelos, plataforma y consultoría, en lugar de quedarse solo como una empresa de modelos
  • Cuenta con un centro de datos de 40 MW en París y también planea centros de datos adicionales, incluido uno en Suecia
  • Su diferencia frente a Anthropic u OpenAI es que ofrece modelos eficientes, abiertos y personalizables que el cliente puede poseer y ejecutar on-premises
  • El mensaje del evento puso más peso en las alianzas que en nuevos modelos o innovaciones técnicas
    • Las colaboraciones con ASML, BNP Paribas y Amazon Alexa+ se presentaron como ejemplos de resolver problemas reales con IA
    • Se presentó Vibe for Work, descrito como un producto similar a Claude for Work

Estrategia de producto y casos de uso

  • Sistemas de agentes y harness

    • Los modelos por sí solos no son suficientes, y el harness cumple la función de agregar contexto, persistencia y aprendizaje
    • El razonamiento (reasoning) se trata como un elemento clave para que el sistema pueda retroceder, recuperarse de errores y mantener la transparencia
    • Las mejores prácticas de una organización se capturan como skills, y evolucionan mientras se trabaja con agentes de IA
  • Modelos pequeños y especializados

    • Mistral muestra casos en los que modelos pequeños, rápidos y bien enfocados superan a los grandes modelos de propósito general en eficiencia energética y velocidad
    • Document AI es un modelo para OCR, y la EU Patent Office lo usa para OCR a gran escala
    • Voxtral es un modelo de voz multilingüe, y se usa para impulsar Amazon Alexa+ en Europa
    • Robostral se usa en robótica industrial junto con ASML
    • En aplicaciones de tipo agente con alto consumo de tokens, la velocidad y la eficiencia se vuelven tan importantes como el rendimiento puro
  • Soberanía y despliegue on-premises

    • BNP Paribas ejecuta modelos de Mistral on-premises en Bélgica para casos de uso de KYC, manteniendo los datos sensibles dentro del banco
    • Abanca usa orquestación de agentes para procesar a gran escala información sensible de más de 1 millón de clientes dentro de su app
    • Para las empresas europeas en industrias reguladas, esto puede ser una alternativa para reducir la dependencia de los hyperscalers de EE. UU.
  • Aplicación en humanidades

    • Un equipo de investigación de la Austrian Academy of Sciences ajustó finamente Codestral, el LLM de programación de Mistral, para leer fragmentos de papiro de miles de años de antigüedad
    • Este trabajo ayuda a hacer accesible una colección de 180 mil documentos hallados en el desierto egipcio
    • Se presentó como una tarea que habría tomado más de 2,000 años sin IA
    • El proyecto Apollo de la Austrian Academy of Sciences muestra un caso en el que la IA también puede contribuir a las humanidades
  • Estrategia europea de socio de IA

    • La visión de Mistral parece estar más cerca de convertirse en un socio europeo de IA full-stack que ofrezca retorno de inversión real hoy, que de ganar la carrera por la AGI
    • El éxito o fracaso de esta estrategia dependerá de si más empresas europeas adoptan el enfoque de Mistral
    • La combinación de modelos abiertos, despliegue on-premises y alianzas empresariales puede resultar atractiva para muchas grandes organizaciones de la UE
    • La era de depender ciegamente de las grandes tecnológicas de EE. UU. está llegando a su fin, y lo importante es que ya apareció un actor europeo serio en IA

1 comentarios

 
GN⁺ 5 시간 전
Comentarios de Hacker News
  • Realmente apoyo a Mistral y a los modelos pequeños especializados en tareas, pero Mistral se ha quedado demasiado atrás desde el tercer trimestre de 2025
    Para competir hoy, necesitas poder correr un buen modelo de razonamiento incluso con una longitud de contexto intermedia, y Mistral no parece poder hacerlo
    En este momento, del lado de los modelos pequeños, Gemma4 y Qwen3.6 son los mejores, y el modelo “small” de Mistral tiene 120B, aproximadamente 4 veces más parámetros, y aun así ni siquiera compite bien con modelos que tienen una cuarta parte de su tamaño
    Hace un año, con Mistral Small 3.1, todavía iba siguiendo el ritmo, pero ahora prácticamente ha desaparecido del mapa
    Si Mistral realmente quiere apuntar en serio al mercado on-premise y al de modelos pequeños especializados en tareas, una buena métrica indirecta podría ser crear un modelo que entusiasme a la gente de r/localLlama

    • De acuerdo. Soy usuario de pago de Le Chat Pro y de verdad apoyo una alternativa europea, pero la brecha de calidad entre Mistral y los laboratorios frontier se está volviendo demasiado grande como para ignorarla
      También preocupa que en la conferencia casi no hayan hablado de modelos nuevos. Personalmente, creo que ese debería ser su principal enfoque
      Me pregunto qué los está frenando. No sé si es dinero, recursos de cómputo, capacidad o datos de entrenamiento
      Para crear un modelo realmente bueno, probablemente hay que entrenar con datos bastante cuestionables, como salidas de modelos frontier, y me preocupa que Mistral sea demasiado europeo y demasiado orientado a clientes empresariales como para asumir ese riesgo
    • Parece que Mistral ha entrado en la fase de exprimir al máximo el dinero de los contribuyentes de la UE en la que terminan muchas empresas tecnológicas europeas que no fueron adquiridas por compañías estadounidenses
      Probablemente acabe como una empresa zombi al estilo Dailymotion
    • Esto se desvía un poco del tema de los modelos pequeños especializados en tareas, pero pregunto desde la ignorancia: ¿hay alguna razón de fondo por la que los proveedores de modelos frontier no lancen modelos más pequeños y enfocados?
      Por ejemplo, pienso en algo como un subconjunto de Opus dedicado solo a software, que fuera el modelo predeterminado en Claude Code
      Sería más pequeño, más barato de desplegar y usar, y quizá también más rápido
    • De acuerdo. Cuando los laboratorios frontier hagan la siguiente subida de precios y reduzcan inevitablemente los límites de los niveles de suscripción, la gente va a replantearse mucho más seriamente qué proveedor de modelos usar
      Para entonces, Mistral debería estar lista, pero viendo sus resultados recientes, la verdad no tengo muchas expectativas
    • Corro LLMs localmente y, personalmente, 22B~32B es el tamaño máximo que estaría dispuesto a probar
      Aunque Mistral 4 tenga 6B de parámetros activos por token y se puedan cargar 3~3.5 parámetros por token en una 4090, unos 240GB de descarga y espacio de almacenamiento ya rozan el límite de lo razonable para probarlo en local
      Más aún si estás descargando y evaluando varios modelos, y también se vuelve más difícil que otras personas hagan fine-tuning posteriores, como ocurrió con modelos anteriores de Mistral/Magistral
  • Escuché la charla de un excelente responsable de TI del gobierno, y estaba evaluando modelos y bastante inconforme con la situación actual
    Quiere usar Mistral y, en algunos casos, incluso es el único modelo basado en la UE que puede usar, pero también sabe que su rendimiento es realmente malo y que cada vez se queda más atrás
    Puede que Mistral logre construir un negocio rentable simplemente por ser el único modelo viable para ciertos usos dentro de la UE. Es triste, y da pena verlo

  • De verdad espero que Europa participe en el desarrollo y la investigación en IA, y también apoyé mucho a Mistral
    Pero la brecha tecnológica se está acumulando demasiado. Si no logran corregir esto, será otra prueba de que Europa no puede operar grandes tecnológicas con buenos resultados
    En la práctica, casi todos los laboratorios chinos lo están haciendo mucho mejor. Sin siquiera hablar de DeepSeek, no fue Mistral quien creó cosas como MiMo 2.5 o Minimax 2.7
    Los modelos de Mistral son más débiles, o más grandes y lentos, o simplemente no tienen mezcla de expertos (MoE), así que no salen bien parados

    • https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
      Europa se disparó en el pie con esta ley hecha a las prisas durante el pico de la histeria colectiva, y ahora ninguna empresa sensata va a querer construir algo ahí
      En Estados Unidos o China, una startup de IA puede empezar con un chico y una computadora, pero en Europa ese chico necesita doce abogados
      Que Mistral, pese a su ventaja inicial, sus modelos tempranos tan prometedores y la inversión recibida, haya perdido presencia, podría ser el resultado de haber intentado cumplir con toda esa regulación
    • No entiendo bien a qué te refieres con que la brecha tecnológica se está acumulando demasiado. ¿No es más fácil y más barato ponerse al día que abrir el camino como líder?
    • En cuanto a la mezcla de expertos (MoE), recuerdo que Mixtral fue el primer modelo que realmente mostró la viabilidad práctica de MoE
      Me impresionó mucho ese informe técnico. Claro, tengo entendido que la idea de MoE en sí ya existía desde antes
      Si hubieran seguido empujando la familia Mixtral, quizá hoy tendrían una reputación como la de la línea Qwen. Fue una oportunidad perdida
    • El gobierno británico anunció hace poco que invertirá 10 millones de libras en investigación de IA, pero probablemente los consultores se queden con la mayor parte
      Comparado con eso, diría que Europa lo está haciendo bastante bien
  • BNP Paribas está ejecutando modelos de Mistral on-premises para KYC en Bélgica, y lo importante es que los datos sensibles permanecen dentro del banco
    Abanca también está usando orquestación de agentes para procesar información sensible de clientes a gran escala, como los 2 millones de clientes de su app
    Para las empresas europeas de industrias reguladas, es una mejor alternativa que depender de hyperscalers de EE. UU., y que Mistral se enfoque en modelos on-premises y con hosting en Europa parece una dirección muy inteligente

    • Dicho con respeto, no me parece una decisión “muy” inteligente. Simplemente es una opción decente en una situación con alternativas limitadas
      Todos están haciendo full-deployment engineering o customer-specific engineering, porque si no, simplemente parecen una empresa que le pone margen al costo de los tokens
      Entonces las empresas Neo-SaaS se van a llevar el dinero. Si no, ¿quién compraría la IA de Mistral y qué otras opciones habría?
    • Que Mistral haya reforzado su experiencia en despliegue a gran escala con la adquisición de Koyeb también fue una decisión muy acertada
    • No creo que Mistral se esté enfocando en generación de contenido como código, imágenes o video
      Más bien parece estar enfocándose en otras áreas como modelos multilingües, OCR y voz
      Su página de presentación de modelos también lo refleja, pero es tan variada y tiene tantas categorías y nombres de modelos que siempre me confunde
      Ojalá sus decisiones den buenos resultados
    • ¿No es este el camino típico de las startups de la UE después de renunciar al mercado B2C o SaaS global a escala mundial? Volver a enfocarse en grandes empresas europeas B2B y contratos gubernamentales
      Para las startups europeas, B2B empresarial siempre me ha parecido un lugar al que uno va a morir
    • Aun así, ¿cuál sería la razón para usar Mistral on-premises en vez de Qwen?
  • Asistí al evento, y el tamaño de los asistentes fue impresionante; estaban todos los líderes de las principales empresas europeas que cotizan en bolsa
    También fue interesante la cantidad de socios invitados. Había de todo, desde Microsoft, Accenture y EY hasta startups como alpic.ai y lingo.dev
    Parece que también están reforzando el movimiento del lado de M&A

  • Dejando el negocio aparte, el diseño del sitio web es realmente excelente: https://mistral.ai/

    • Se ve demasiado complejo y la disposición de los párrafos está desalineada
    • No sé específicamente qué tiene de bueno. Lo revisé haciendo scroll en el teléfono y me pareció un sitio corporativo bastante normal
    • Me gusta todo el branding de Mistral
  • Me llegó un correo de Mistral diciendo que van a retirar gradualmente para agosto algunos, quizá la mayoría, de sus modelos dedicados como devstral, y que ahora usemos modelos de propósito general
    El costo crece de forma exponencial
    Dice que recomiendan migrar de Devstral 2(devstral-2512 y devstral-latest) al modelo más potente Mistral Medium 3.5(mistral-medium-3-5, con reasoning_effort configurado en "high"), y el precio es de $1.5/$7.5 por millón de tokens de entrada/salida
    Antes era $0.4/$2

    • Recibí el mismo correo, pero como pensaba que ya había migrado todo a Mistral-Medium-3.5, no tengo muy claro qué modelo próximo a descontinuarse seguía usando
      De todos modos, después de recibir el correo, quise pensar que era una señal de que van a lanzar modelos nuevos y mejorados en los próximos meses
  • No parece tener ningún moat. Se siente como una empresa de consultoría de software con data centers
    Además, en el texto dicen que muchos clientes usan estos modelos on-premises, así que los data centers tampoco serían una ventaja real
    ¿Qué impediría que cualquier startup con apoyo del gobierno fine-tunee un pequeño modelo open source?

    • Tal vez porque si destilas modelos pequeños desde un modelo más grande que controlas directamente, puedes obtener un modelo pequeño mejor que si lo fine-tuneas a partir de un modelo más grande que no controlas
      No digo que eso sea cierto, solo que es una suposición posible
  • Como europeo, estoy 100 veces de acuerdo
    De todos estos jugadores, realmente me gusta la dirección y la transparencia de Mistral

    • Incluso si no eres europeo, es bueno ver a un competidor europeo enfrentando a los modelos de EE. UU. y China
  • Dicen que Abanca usa orquestación de agentes para procesar información sensible de clientes a una “escala enorme” de 2 millones de clientes de la app, pero no sé si mi criterio de lo que es escala enorme está distorsionado
    ¿2 millones de usuarios no serían apenas unos cientos de MB de datos? Incluso si hubiera muchos datos por usuario, parecerían apenas unos cuantos GB

    • Tal vez, pero si resuelves consultas de soporte al cliente con los modelos de lenguaje grandes más recientes de forma agentic, el consumo de tokens se dispara rápidamente
      Por lo que entendí de la presentación, parece que usaron agentes con responsabilidad limitada y probablemente modelos más pequeños para que las respuestas fueran rápidas, estables y no demasiado costosas
    • A las empresas orientadas al consumidor en Europa les cuesta más escalar con facilidad que a las empresas estadounidenses, y esa es una de las grandes razones de los problemas que tiene Europa en general para hacer crecer empresas tecnológicas
      En cambio, ese tipo de negocio puede tener bastante capacidad defensiva, pero por lo general no se traduce en una rentabilidad igual de alta