Presentan la preview de Gemini 2.5 Pro: el modelo de IA de Google ahora es más potente para código

(developers.googleblog.com)

8 puntos por GN⁺ 2025-05-07 | 1 comentarios | Compartir por WhatsApp

Google lanzó anticipadamente Gemini 2.5 Pro Preview (I/O Edition) antes del evento oficial de I/O, con el objetivo de incorporar feedback de desarrolladores y mejorar el rendimiento
Destaca especialmente en desarrollo frontend y de UI, con mejoras en transformación de código, edición y juicio de abstracción
Basado en un rendimiento de 84.8% en el benchmark VideoMME, ahora permite la generación automática de apps de aprendizaje basadas en video
Mediante razonamiento de diseño, también permite implementar fácilmente generación de UI adaptada al estilo y agregar funciones
La versión previa del 25 de marzo se actualizará automáticamente a la versión del 6 de mayo, por lo que será posible usar el modelo mejorado sin trabajo adicional

Rendimiento sobresaliente en desarrollo frontend

Gemini 2.5 Pro ocupa el primer lugar en el leaderboard de WebDev Arena
Demostró rendimiento de primer nivel en evaluaciones de preferencia humana, con base en UI estéticamente agradables y alto nivel de funcionalidad
A través de colaboraciones con Cognition y Replit, está ampliando las posibilidades de la programación orientada a agentes

Combinación de comprensión de código y capacidad de razonamiento

Función de video → código
- Con un 84.8% de rendimiento en el benchmark VideoMME, alcanza un nivel SOTA en comprensión de video
- Permite la generación automática de apps de aprendizaje interactivas basadas en videos de YouTube
- Entrega resultados con mejor UI general y mejor nivel de interacción que la versión anterior
Automatización del desarrollo de funciones
- Antes era necesario abrir archivos del diseñador y convertir manualmente a CSS colores, fuentes, márgenes, etc.
- Gemini 2.5 Pro permite la generación automática de componentes adaptados al estilo
- Ejemplo: puede automatizar la incorporación de una función de reproductor de video con el mismo estilo de la app Gemini 95
Mayor velocidad de idea → implementación de app
- Como en el caso de la dictation starter app, permite crear apps considerando al mismo tiempo funcionalidad + acabado estético
- Genera automáticamente elementos de UI detallados como animación de forma de onda, diseño responsivo y efectos hover
- Aun sin que el usuario diseñe directamente, produce resultados con sentido estético por defecto

Incorporación del feedback de desarrolladores y forma de uso

Frente a la versión anterior, se logró una reducción en la tasa de error de llamadas a funciones y una mejora en los disparadores de invocación
La versión 03-25 ahora apuntará automáticamente a la versión 05-06 → se aplica sin necesidad de actualización adicional
Puede usarse de inmediato en Google AI Studio y Vertex AI
La model card también fue actualizada con la información más reciente
Se actualiza automáticamente a la versión más reciente y se ofrece sin cambios de precio

Casos de uso y expectativas

Replit, Cursor y Cognition, entre otros, están evaluando o aplicando su adopción como agente de codificación de próxima generación
Se espera que contribuya a expandir los flujos de desarrollo orientados a agentes desde desarrolladores individuales hasta empresas

1 comentarios

GN⁺ 2025-05-07

Opiniones en Hacker News

En el pasado, la mayor queja al usar estos modelos para programar era su tendencia a inventar APIs que no existen. Con los modelos Gemini 2.5, especialmente las versiones Pro y Flash, este problema ocurre menos que con otros modelos
- Aun así, sigue habiendo limitaciones considerables, y es imposible que los modelos actuales aborden la abstracción y la arquitectura como lo hace una persona
- Sin embargo, los modelos Gemini ya han logrado reemplazar la búsqueda y Stack Overflow en la programación cotidiana
Gemini 2.5 Pro ocupa el primer lugar en la tabla de clasificación de WebDev Arena
- Parecería razonable renombrar WebDev Arena a React/Tailwind Arena
- El prompt del sistema exige estas tecnologías, y toda la herramienta deja de funcionar cuando se pide vanilla JS u otros frameworks
- Es problemático que los modelos compitan bajo una definición tan estrecha de desarrollo web
Al pedirle código a Gemini 2.5, genera demasiados comentarios
- Incluye una cantidad excesiva de comentarios: de sección, de pasos, de bloques, en línea, etc.
Gemini 2.5 destaca en tareas de agente, pero todavía tiene dificultades para generar diffs perfectos para edición de código
- El Gemini 2.5 anterior generaba diffs adecuados con una precisión del 92%
- Se espera que esta tasa aumente a 95-98%
Pregunta para alguien de Google: quisiera saber si Gemini-2.5-pro-exp (la versión gratuita) también fue actualizado o si va a desaparecer
- Según la publicación del blog, la versión anterior (03-25) ahora apunta a la versión más reciente (05-06), y no hace falta ninguna acción adicional para usar el modelo mejorado
- Quisiera saber si Gemini-2.5-pro-preview-03-25 ahora usa 05-06, y si lo mismo aplica a Gemini-2.5-pro-exp-03-25
Al comparar los benchmarks de la experimental 03-25 y la experimental 05-06, la nueva versión obtiene puntuaciones ligeramente más bajas en todo excepto en LiveCodeBench
Uso Gemini para casi todo, pero la model card solo lo compara con o3-mini
- En benchmarks conocidos, o3 sigue estando por delante
Gemini 2.5 pro es excelente, pero la UI todavía tiene problemas de scroll que la hacen difícil de usar
- Conviene esperar unos minutos después de que termine la salida de la IA
- También es confiable buscar el elemento ms-code-block en las herramientas de desarrollo y registrar $0.textContext
Gemini 2.5 pro es excelente, pero cuesta muchísimo y ofrece una visibilidad de costos muy poco transparente
- Últimamente mucha gente ha recibido facturas inesperadas, y para algunos el uso normal terminó costando $500
- A mí también me afectó, así que eliminé la API key de la herramienta
Este modelo rinde peor que 03-25 en 10 de 12 benchmarks
- Siguieron entrenándolo para código, todo empeoró, y probablemente intentaron ocultarlo por costo hundido
No entiendo por qué no pueden usar números de versión en lugar de "nuevo preview"
- Por ejemplo, estaría bien llamarlo Gemini Pro 2.5.1

Presentan la preview de Gemini 2.5 Pro: el modelo de IA de Google ahora es más potente para código

Rendimiento sobresaliente en desarrollo frontend

Combinación de comprensión de código y capacidad de razonamiento

Función de video → código

Automatización del desarrollo de funciones

Mayor velocidad de idea → implementación de app

Incorporación del feedback de desarrolladores y forma de uso

Casos de uso y expectativas

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News