- Google presentó nuevas versiones preview de Gemini 2.5 Flash y 2.5 Flash-Lite, con mejoras clave en calidad y eficiencia
- Flash-Lite está optimizado para entornos de alta velocidad y bajo costo gracias a una mejor comprensión de instrucciones, menos respuestas verbosas y mejoras en capacidades multimodales y de traducción
- Flash logra un gran aumento de rendimiento en tareas complejas de tipo agente con mejor uso de herramientas y mayor eficiencia de tokens
- En pruebas reales, la puntuación de SWE-Bench Verified subió 5%, y en benchmarks internos el rendimiento en tareas de largo plazo mejoró 15%
- Ambos modelos son compatibles con el alias
-latest, lo que permite usar las funciones más recientes sin modificar el código, y quienes necesiten estabilidad pueden seguir usando los modelos 2.5 existentes
Resumen de Gemini 2.5 Flash y Flash-Lite
- La versión más reciente de Gemini 2.5 Flash y Flash-Lite ya está disponible en Google AI Studio y Vertex AI. El objetivo de este lanzamiento es seguir ofreciendo mejor calidad de modelo y mayor eficiencia
- El nuevo Flash-Lite y Flash muestran mejoras importantes frente a los modelos anteriores en calidad general, velocidad y costo
- Flash-Lite reduce en 50% los tokens de salida, y Flash en 24%, lo que permite ahorrar costos operativos y acelerar el procesamiento
Gemini 2.5 Flash-Lite actualizado
- Mayor capacidad para seguir instrucciones: mejoró notablemente la comprensión y ejecución de instrucciones complejas o system prompts
- Más concisión: genera respuestas más cortas y fáciles de entender, lo que reduce el costo por tokens y la latencia en entornos con mucho tráfico
- Mejor calidad multimodal y de traducción: aumenta la confiabilidad en transcripción de audio, reconocimiento de imágenes y traducción
- La versión preview de Flash-Lite puede probarse de inmediato con el nombre de modelo
gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash actualizado
- Mejor uso de herramientas: aumentó notablemente su utilidad en escenarios complejos de varios pasos basados en agentes, logrando una mejora de 5 puntos porcentuales frente a la versión anterior en SWE-Bench Verified (48.9% → 54%)
- Mejor eficiencia de costos: ofrece mayor calidad de salida con menos uso de tokens, reduciendo latencia y costos de infraestructura
- Los comentarios de los usuarios de Primer también han sido positivos
- Yichao ‘Peak’ Ji, cofundador y Chief Scientist de Manus, comentó: "El nuevo modelo Gemini 2.5 Flash ofrece tanto una velocidad sorprendente como inteligencia. En tareas de agentes basadas en objetivos de largo plazo, el rendimiento mejoró 15%, lo que permite escalar aún más gracias a su eficiencia de costos"
- La versión preview de Gemini 2.5 Flash está disponible con el nombre de modelo
gemini-2.5-flash-preview-09-2025
Empezar a crear con Gemini
- Durante el último año, el lanzamiento de modelos preview permitió que los desarrolladores probaran rápidamente funciones nuevas y aportaran retroalimentación
- Las versiones preview anunciadas hoy no pasan oficialmente a ser una nueva versión estable, sino que se usan como base para mejorar la calidad de la próxima versión oficial
- Se agregó el alias
-latest para evitar nombres de modelo largos y facilitar el uso permanente del modelo más reciente. Este alias apunta automáticamente a la versión más nueva, por lo que permite probar nuevas funciones sin cambiar el código
gemini-flash-latest
gemini-flash-lite-latest
- Si una versión específica se actualiza o se descontinúa, se notificará por correo electrónico con al menos 2 semanas de anticipación. El alias es solo una referencia, y el precio, las funciones y los límites pueden variar según cada lanzamiento
- Para quienes necesiten estabilidad a largo plazo, se recomienda seguir usando los nombres de modelo
gemini-2.5-flash y gemini-2.5-flash-lite
Importancia
- Este lanzamiento es una actualización preview, no una promoción a versión estable oficial, y forma parte del proceso para experimentar y recopilar comentarios de usuarios con miras a futuros modelos estables
- Con Gemini, Google busca equilibrar velocidad, inteligencia y eficiencia de costos, y sigue mejorando para ayudar a los desarrolladores a crear mejores aplicaciones de IA
1 comentarios
Opiniones en Hacker News
application/jsonen la solicitud, ya no se pueden usar herramientas; y si quieres usar ambos, tienes que esperar a la fuerza que el JSON salga bien (algo que falla seguido), o usar herramientas en la primera solicitud y formatear en una segunda. Es engorroso, pero el workaround es relativamente simplellm-gemini. Se puede ejecutar conuvxsin instalación aparte. Ejemplo:Las notas de lanzamiento están aquí. Para la discusión sobre pelícanos, ver esta publicación
gemini-2.5-flash-lite-preview-09-2025ygemini-2.5-flash-preview-09-2025