8 puntos por GN⁺ 2025-05-07 | 1 comentarios | Compartir por WhatsApp
  • Google lanzó anticipadamente Gemini 2.5 Pro Preview (I/O Edition) antes del evento oficial de I/O, con el objetivo de incorporar feedback de desarrolladores y mejorar el rendimiento
  • Destaca especialmente en desarrollo frontend y de UI, con mejoras en transformación de código, edición y juicio de abstracción
  • Basado en un rendimiento de 84.8% en el benchmark VideoMME, ahora permite la generación automática de apps de aprendizaje basadas en video
  • Mediante razonamiento de diseño, también permite implementar fácilmente generación de UI adaptada al estilo y agregar funciones
  • La versión previa del 25 de marzo se actualizará automáticamente a la versión del 6 de mayo, por lo que será posible usar el modelo mejorado sin trabajo adicional

Rendimiento sobresaliente en desarrollo frontend

  • Gemini 2.5 Pro ocupa el primer lugar en el leaderboard de WebDev Arena
  • Demostró rendimiento de primer nivel en evaluaciones de preferencia humana, con base en UI estéticamente agradables y alto nivel de funcionalidad
  • A través de colaboraciones con Cognition y Replit, está ampliando las posibilidades de la programación orientada a agentes

Combinación de comprensión de código y capacidad de razonamiento

  • Función de video → código

    • Con un 84.8% de rendimiento en el benchmark VideoMME, alcanza un nivel SOTA en comprensión de video
    • Permite la generación automática de apps de aprendizaje interactivas basadas en videos de YouTube
    • Entrega resultados con mejor UI general y mejor nivel de interacción que la versión anterior
  • Automatización del desarrollo de funciones

    • Antes era necesario abrir archivos del diseñador y convertir manualmente a CSS colores, fuentes, márgenes, etc.
    • Gemini 2.5 Pro permite la generación automática de componentes adaptados al estilo
    • Ejemplo: puede automatizar la incorporación de una función de reproductor de video con el mismo estilo de la app Gemini 95
  • Mayor velocidad de idea → implementación de app

    • Como en el caso de la dictation starter app, permite crear apps considerando al mismo tiempo funcionalidad + acabado estético
    • Genera automáticamente elementos de UI detallados como animación de forma de onda, diseño responsivo y efectos hover
    • Aun sin que el usuario diseñe directamente, produce resultados con sentido estético por defecto

Incorporación del feedback de desarrolladores y forma de uso

  • Frente a la versión anterior, se logró una reducción en la tasa de error de llamadas a funciones y una mejora en los disparadores de invocación
  • La versión 03-25 ahora apuntará automáticamente a la versión 05-06 → se aplica sin necesidad de actualización adicional
  • Puede usarse de inmediato en Google AI Studio y Vertex AI
  • La model card también fue actualizada con la información más reciente
  • Se actualiza automáticamente a la versión más reciente y se ofrece sin cambios de precio

Casos de uso y expectativas

  • Replit, Cursor y Cognition, entre otros, están evaluando o aplicando su adopción como agente de codificación de próxima generación
  • Se espera que contribuya a expandir los flujos de desarrollo orientados a agentes desde desarrolladores individuales hasta empresas

1 comentarios

 
GN⁺ 2025-05-07
Opiniones en Hacker News
  • En el pasado, la mayor queja al usar estos modelos para programar era su tendencia a inventar APIs que no existen. Con los modelos Gemini 2.5, especialmente las versiones Pro y Flash, este problema ocurre menos que con otros modelos

    • Aun así, sigue habiendo limitaciones considerables, y es imposible que los modelos actuales aborden la abstracción y la arquitectura como lo hace una persona
    • Sin embargo, los modelos Gemini ya han logrado reemplazar la búsqueda y Stack Overflow en la programación cotidiana
  • Gemini 2.5 Pro ocupa el primer lugar en la tabla de clasificación de WebDev Arena

    • Parecería razonable renombrar WebDev Arena a React/Tailwind Arena
    • El prompt del sistema exige estas tecnologías, y toda la herramienta deja de funcionar cuando se pide vanilla JS u otros frameworks
    • Es problemático que los modelos compitan bajo una definición tan estrecha de desarrollo web
  • Al pedirle código a Gemini 2.5, genera demasiados comentarios

    • Incluye una cantidad excesiva de comentarios: de sección, de pasos, de bloques, en línea, etc.
  • Gemini 2.5 destaca en tareas de agente, pero todavía tiene dificultades para generar diffs perfectos para edición de código

    • El Gemini 2.5 anterior generaba diffs adecuados con una precisión del 92%
    • Se espera que esta tasa aumente a 95-98%
  • Pregunta para alguien de Google: quisiera saber si Gemini-2.5-pro-exp (la versión gratuita) también fue actualizado o si va a desaparecer

    • Según la publicación del blog, la versión anterior (03-25) ahora apunta a la versión más reciente (05-06), y no hace falta ninguna acción adicional para usar el modelo mejorado
    • Quisiera saber si Gemini-2.5-pro-preview-03-25 ahora usa 05-06, y si lo mismo aplica a Gemini-2.5-pro-exp-03-25
  • Al comparar los benchmarks de la experimental 03-25 y la experimental 05-06, la nueva versión obtiene puntuaciones ligeramente más bajas en todo excepto en LiveCodeBench

  • Uso Gemini para casi todo, pero la model card solo lo compara con o3-mini

    • En benchmarks conocidos, o3 sigue estando por delante
  • Gemini 2.5 pro es excelente, pero la UI todavía tiene problemas de scroll que la hacen difícil de usar

    • Conviene esperar unos minutos después de que termine la salida de la IA
    • También es confiable buscar el elemento ms-code-block en las herramientas de desarrollo y registrar $0.textContext
  • Gemini 2.5 pro es excelente, pero cuesta muchísimo y ofrece una visibilidad de costos muy poco transparente

    • Últimamente mucha gente ha recibido facturas inesperadas, y para algunos el uso normal terminó costando $500
    • A mí también me afectó, así que eliminé la API key de la herramienta
  • Este modelo rinde peor que 03-25 en 10 de 12 benchmarks

    • Siguieron entrenándolo para código, todo empeoró, y probablemente intentaron ocultarlo por costo hundido
  • No entiendo por qué no pueden usar números de versión en lugar de "nuevo preview"

    • Por ejemplo, estaría bien llamarlo Gemini Pro 2.5.1