Mistral AI agrega Deep Research, Voice, Projects y más a Le Chat

(mistral.ai)

3 puntos por GN⁺ 2025-07-18 | 1 comentarios | Compartir por WhatsApp

Mistral AI agregó cinco nuevas funciones a Le Chat para que explorar, expresarse y organizarse sea más natural y potente para los usuarios
El modo Deep Research ofrece una función que organiza rápidamente preguntas complejas en reportes de investigación estructurados
El modo de voz permite conversaciones naturales y rápidas mediante el nuevo modelo de voz Voxtral, y puede usarse sin necesidad de escribir
La función de razonamiento multilingüe basada en Magistral genera respuestas claras y profundas en varios idiomas, e incluso permite cambiar de idioma dentro de una misma oración
La función Projects organiza y recuerda conversaciones, documentos e ideas por proyecto, por lo que también es adecuada para trabajos de largo plazo

What’s new in Le Chat.

1. Modo Deep Research

Función que investiga rápidamente temas complejos en un formato de reporte estructurado
Desglosa la pregunta del usuario, busca fuentes confiables y genera un informe organizado
Aunque usa un agente de Deep Research basado en herramientas, la experiencia para el usuario es simple, transparente y da la sensación de colaboración

2. Modo de voz

Permite conversaciones de voz naturales usando un nuevo modelo de voz llamado Voxtral
Es adecuado para distintas situaciones, como hacer lluvia de ideas mientras caminas, responder preguntas rápidas al salir o transcribir el contenido de reuniones
Sigue el ritmo del habla del usuario con baja latencia

3. Razonamiento multilingüe nativo

Basado en el modelo de razonamiento Magistral, responde con claridad a preguntas complejas en varios idiomas
Resulta útil para usos multilingües, como redactar un borrador de propuesta en español o explicar conceptos legales en japonés
También permite cambiar de idioma dentro de una oración (code-switching)

4. Projects

Organiza conversaciones relacionadas en carpetas centradas en el contexto
Cada proyecto recuerda su propia biblioteca y el estado de configuración de herramientas
Permite mantener un entorno de trabajo consistente junto con carga de documentos, recuperación del contenido de la biblioteca, conversaciones e ideas
Es útil para planear una mudanza, diseñar funciones de producto y gestionar proyectos de largo plazo

5. Edición avanzada de imágenes

A diferencia de las herramientas comunes de generación de texto a imagen, también permite editar directamente las imágenes generadas
Por ejemplo, se puede modificar la escena con prompts como “eliminar objeto” o “mover a otra ciudad”
Permite editar en serie manteniendo la consistencia de personas, objetos y elementos de diseño

1 comentarios

GN⁺ 2025-07-18

Comentarios en Hacker News

La función de edición de imágenes parece realmente sobresaliente; de hecho, se siente como su punto fuerte, aunque no se note tanto. Los modelos de OpenAI tienden a modificar toda la imagen y a dañar incluso detalles que no tienen relación con la consulta, pero este modelo preserva perfectamente las partes no relacionadas con la solicitud y aplica muy bien solo la edición deseada. Eso sí, la resolución de salida deja algo que desear (la imagen de entrada era mucho más grande, pero el resultado quedó en 1184px). Subí una foto de mi oficina en casa y le pedí: "restaura por completo los paneles grises algo rasgados de la parte inferior para que parezcan completamente nuevos", y el resultado fue bastante bueno. La calidad de salida es apenas un poco inferior a la original, pero espero que eso también mejore pronto.
- Imagen de entrada: https://i.imgur.com/t0WCKAu.jpeg
- Imagen de resultado: https://i.imgur.com/xb99lmC.png
- Creo que esta tecnología le va a pegar fuerte a Craigslist. Por ejemplo, ves un auto en fotos y parece estar perfecto, pero cuando llegas resulta que el guardafango está abollado, el cofre tiene un agujero y además el faro está roto.
  Hubo un caso en el que un agente inmobiliario usó IA para rehacer por completo las fotos de una casa (haciendo que una casa vieja pareciera de nueva construcción). La gente fue a verla en persona y se enfureció muchísimo. El agente dijo que era solo otra etapa del home staging, pero en este caso no coló para nada. Al final retiraron la propiedad del mercado y también llegó mucha gente ofreciendo reparaciones (probablemente familiares, aunque no está claro).
- Para que lo sepas, los enlaces de la imagen de entrada y la imagen de resultado que publicaste son iguales. Al principio me confundí tratando de encontrar la diferencia entre las fotos.
- Para ciertas tareas, probablemente Kontext sea mejor, y quizá Mistral esté usando eso. Sobre todo, es rápido y barato.
  Pero OpenAI también agregó ayer una nueva función de edición de imágenes en mayor resolución. Todavía no sé si eso aplica solo a la API o también llegará a la interfaz de chat. Resultado con el mismo prompt y la misma imagen de entrada: https://i.imgur.com/w5Q0UQm.png
- Novedad de OpenAI: https://x.com/OpenAIDevs/status/1945538534884135132
- Están usando Flux Kontext de Black Forest Labs, y es un modelo realmente excelente.
- En el resultado de la imagen, los títulos de los libros salen distorsionados.
Por fin siento que la UE despertó. Me enorgullece. En cuanto termine mi contrato con OpenAI, pienso cambiarme de inmediato a Mistral. Hay que apoyar a Europa, Viva La France.
- En realidad, yo solo estoy esperando Mistral Large 3. Ya ha habido insinuaciones y parece que pronto lo pondrán como modelo de lenguaje predeterminado del nuevo Le Chat.
  En el "One more thing" del post del blog de Mistral Medium 3 de mayo decía esto:
En marzo Mistral Small, hoy Medium, y pronto nos preparamos para lanzar 'large'. Como el modelo Medium ya supera claramente a otros modelos abiertos de referencia (como Llama 4 Maverick), ilusiona pensar en el siguiente paso.
Con esta versión, la brecha con los mejores modelos grandes quizá ya ni siquiera tenga mucha importancia. La velocidad de Cerebras ofrece una experiencia de usuario realmente excelente incluso comparada con ChatGPT.
Estoy sufriendo de MRF, o sea Model Release Fatigue. Salen modelos enormes con demasiada frecuencia, así que uno sigue cambiando de modelo en el IDE y cuando vuelve a encender algo que antes funcionaba bien, ahora ya se ve peor.
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral… si uno cambia todo el tiempo, acaba sintiéndose mareado.
Es fatiga por estar cambiando de modelo LLM.
- Entiendo cómo te sientes, pero creo que es muy bueno que sigan apareciendo tantas opciones. El ritmo de innovación también es excelente. Si quieres usar siempre el mejor modelo de todos, va a ser un camino duro, pero me parece mucho mejor que el estancamiento o el monopolio.
- Por eso casi no pruebo estas tecnologías nuevas (aunque sí me parecen divertidas). Pienso usarlas por mi cuenta hacia la segunda mitad de 2026. Para entonces ya se habrán desarrollado los modelos locales y el hardware.
  Mi respeto para quienes están lidiando con estas versiones experimentales ahora mismo.
- De hecho, esta competencia es algo muy bueno. Yo siempre uso solo modelos premium y casi no gasto dinero. Siempre hay promociones o oportunidades casi gratis.
- Ni siquiera hace falta seguirles el paso. Basta con usar de forma constante un solo modelo que te funcione bien.
- Si el rendimiento de la versión anterior baja, es porque el proveedor del servicio concentra sus recursos en la nueva versión. También influye el corte de datos de entrenamiento de las versiones anteriores (por ejemplo, claude sonnet 3.5→3.7).
  Personalmente, yo solo uso Claude/Anthropic. Me entiende mejor. Es suficientemente inteligente como para que no haga mucha falta usar siempre la versión más nueva.
Lo interesante del lanzamiento de Voxtral fue que volvió a activarse la competencia en transcripción de audio open source (transcription, voz→texto). No estoy seguro de que realmente hiciera falta un backbone de LLM, pero aun así el enfoque es interesante.
- En realidad hay muchos más modelos open source de reconocimiento de voz (STT) muy potentes.
  El comunicado de Mistral da la impresión de que es lo mejor desde Whisper, pero en realidad los modelos con los que se compara no están entre los punteros.
  Benchmark abierto: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
  Para referencia, Scribe, con el que comparó Mistral, está en el puesto 10.
  Es un benchmark en inglés, pero como también hay muchos modelos multilingües, sirve de referencia (ej. https://huggingface.co/nvidia/canary-1b-flash).
Ahora me interesan mucho más los modelos de datos abiertos (y verificables también en lo ético) que el open code o los open weights.
Por ejemplo, me gustaría usar un modelo que me diga si un recurso específico que yo indique fue incluido o no en los datos de entrenamiento.
Últimamente no puedo quitarme la impresión de que la industria de la IA solo está copiando el servicio de OpenAI.
Los servicios de otras empresas, salvo por la estructura, son prácticamente lo mismo.
La innovación en sí tampoco parece tan alta en la práctica.
- Si los usas de verdad, no son iguales para nada. En tareas cotidianas como programar, las diferencias entre modelos son muy grandes.
- Ahora da la sensación de que todo el mundo está construyendo nuevos servicios sobre una función f(input: string): string. Es inevitable que se parezcan.
- OpenAI también tomó la función Deep Research de Google. Usó el mismo nombre, y Mistral también hizo lo mismo.
- En realidad, esto es una competencia de mercado bastante sana. Casos como Apple, que ha seguido innovando durante décadas, son producto de un control monopólico de acceso.
- Al final, casi la misma tecnología se está aplicando en todas partes. La diferencia es más bien la cantidad de datos de entrenamiento y la potencia de cómputo.
Uso muchísimo ChatGPT. También quiero probar Le Chat, pero me pregunto si habrá una gran diferencia o si será casi lo mismo.
Si todavía no has probado la función Deep Research de OpenAI, te recomiendo mucho hacerlo. Aún no he encontrado una alternativa que realmente esté a la altura. También probé la de Google, pero no me impresionó demasiado.
Para ingenieros que investigan trade-offs, puede ahorrar una cantidad enorme de tiempo.
- La función Research de Anthropic también está bastante bien. Creo que está al nivel de OpenAI.
  La de Google, en su versión pagada, es un poco más precisa, pero los reportes son demasiado largos y cansados de leer. Se sienten como el típico trabajo universitario inflado solo para cumplir con un número de palabras.
- A mí me ha ayudado muchísimo sobre todo en investigación de mercado (relacionada con startups). Es como haber contratado a un asistente junior muy inteligente de planeación/PM.
- También te recomendaría probar la función de research de Kimi 2. Me sorprendió lo buenos que fueron los resultados.
- Los resultados de OpenAI y Gemini salen bastante distintos. No diría que uno es mejor que el otro; simplemente son claramente diferentes.
- Perplexities tampoco está mal. Pero como no tengo la suscripción pagada de OpenAI, no puedo compararlos directamente.
Los ejemplos de prompts no son buenos. Por ejemplo, en la respuesta sobre planificación personal, sería mucho mejor responder directamente sin Deep Research (solo responde bien la parte de la visa).
Me pregunto si Voxtral podría llegar a integrarse en el teclado Futo para Android.

Mistral AI agrega Deep Research, Voice, Projects y más a Le Chat

What’s new in Le Chat.

1. Modo Deep Research

2. Modo de voz

3. Razonamiento multilingüe nativo

4. Projects

5. Edición avanzada de imágenes

Lecturas relacionadas

1 comentarios

Comentarios en Hacker News