- Google lanzó anticipadamente Gemini 2.5 Pro Preview (I/O Edition) antes del evento oficial de I/O, con el objetivo de incorporar feedback de desarrolladores y mejorar el rendimiento
- Destaca especialmente en desarrollo frontend y de UI, con mejoras en transformación de código, edición y juicio de abstracción
- Basado en un rendimiento de 84.8% en el benchmark VideoMME, ahora permite la generación automática de apps de aprendizaje basadas en video
- Mediante razonamiento de diseño, también permite implementar fácilmente generación de UI adaptada al estilo y agregar funciones
- La versión previa del 25 de marzo se actualizará automáticamente a la versión del 6 de mayo, por lo que será posible usar el modelo mejorado sin trabajo adicional
Rendimiento sobresaliente en desarrollo frontend
- Gemini 2.5 Pro ocupa el primer lugar en el leaderboard de WebDev Arena
- Demostró rendimiento de primer nivel en evaluaciones de preferencia humana, con base en UI estéticamente agradables y alto nivel de funcionalidad
- A través de colaboraciones con Cognition y Replit, está ampliando las posibilidades de la programación orientada a agentes
Combinación de comprensión de código y capacidad de razonamiento
-
Función de video → código
- Con un 84.8% de rendimiento en el benchmark VideoMME, alcanza un nivel SOTA en comprensión de video
- Permite la generación automática de apps de aprendizaje interactivas basadas en videos de YouTube
- Entrega resultados con mejor UI general y mejor nivel de interacción que la versión anterior
-
Automatización del desarrollo de funciones
- Antes era necesario abrir archivos del diseñador y convertir manualmente a CSS colores, fuentes, márgenes, etc.
- Gemini 2.5 Pro permite la generación automática de componentes adaptados al estilo
- Ejemplo: puede automatizar la incorporación de una función de reproductor de video con el mismo estilo de la app Gemini 95
-
Mayor velocidad de idea → implementación de app
- Como en el caso de la dictation starter app, permite crear apps considerando al mismo tiempo funcionalidad + acabado estético
- Genera automáticamente elementos de UI detallados como animación de forma de onda, diseño responsivo y efectos hover
- Aun sin que el usuario diseñe directamente, produce resultados con sentido estético por defecto
Incorporación del feedback de desarrolladores y forma de uso
- Frente a la versión anterior, se logró una reducción en la tasa de error de llamadas a funciones y una mejora en los disparadores de invocación
- La versión 03-25 ahora apuntará automáticamente a la versión 05-06 → se aplica sin necesidad de actualización adicional
- Puede usarse de inmediato en Google AI Studio y Vertex AI
- La model card también fue actualizada con la información más reciente
- Se actualiza automáticamente a la versión más reciente y se ofrece sin cambios de precio
Casos de uso y expectativas
- Replit, Cursor y Cognition, entre otros, están evaluando o aplicando su adopción como agente de codificación de próxima generación
- Se espera que contribuya a expandir los flujos de desarrollo orientados a agentes desde desarrolladores individuales hasta empresas
1 comentarios
Opiniones en Hacker News
En el pasado, la mayor queja al usar estos modelos para programar era su tendencia a inventar APIs que no existen. Con los modelos Gemini 2.5, especialmente las versiones Pro y Flash, este problema ocurre menos que con otros modelos
Gemini 2.5 Pro ocupa el primer lugar en la tabla de clasificación de WebDev Arena
Al pedirle código a Gemini 2.5, genera demasiados comentarios
Gemini 2.5 destaca en tareas de agente, pero todavía tiene dificultades para generar diffs perfectos para edición de código
Pregunta para alguien de Google: quisiera saber si Gemini-2.5-pro-exp (la versión gratuita) también fue actualizado o si va a desaparecer
Al comparar los benchmarks de la experimental 03-25 y la experimental 05-06, la nueva versión obtiene puntuaciones ligeramente más bajas en todo excepto en LiveCodeBench
Uso Gemini para casi todo, pero la model card solo lo compara con o3-mini
Gemini 2.5 pro es excelente, pero la UI todavía tiene problemas de scroll que la hacen difícil de usar
ms-code-blocken las herramientas de desarrollo y registrar$0.textContextGemini 2.5 pro es excelente, pero cuesta muchísimo y ofrece una visibilidad de costos muy poco transparente
Este modelo rinde peor que 03-25 en 10 de 12 benchmarks
No entiendo por qué no pueden usar números de versión en lugar de "nuevo preview"