Gemini 3 para desarrolladores: nuevas capacidades de razonamiento y agentes

(blog.google)

5 puntos por GN⁺ 2025-11-19 | 2 comentarios | Compartir por WhatsApp

Gemini 3 Pro es el modelo de IA más reciente presentado por Google, con mejores capacidades de razonamiento y rendimiento en programación que la versión anterior
Es compatible con un entorno de desarrollo orientado a agentes y puede usarse en diversas plataformas como Google AI Studio, Vertex AI y Antigravity
Con la función de “vibe coding”, que crea apps solo con lenguaje natural, es posible producir una aplicación completa con un solo prompt
Se reforzaron las capacidades de comprensión multimodal, razonamiento visual, espacial y de video, ampliando su utilidad en imágenes complejas, videos y tareas de UI
Al integrarse en todo el flujo de trabajo del desarrollador, se perfila como un nuevo estándar para el desarrollo de software impulsado por IA

Resumen de Gemini 3 Pro

Gemini 3 Pro es el modelo más inteligente de Google y supera a la versión anterior en los principales benchmarks de IA
- Frente a 2.5 Pro, mejora el rendimiento de programación y la capacidad para resolver tareas de zero-shot
Se integra de forma natural con flujos de trabajo orientados a agentes y con entornos de programación existentes, habilitando nuevos casos de uso
La política de precios es de 2 dólares por cada millón de tokens de entrada y 12 dólares por cada millón de tokens de salida (para prompts de hasta 200k tokens)
La versión preview está disponible en Google AI Studio y Vertex AI, y parte de la oferta se puede usar gratis

Gemini 3 Pro obtuvo 54.2% en Terminal-Bench 2.0, demostrando su capacidad para usar herramientas basadas en terminal
Se integra con Google Antigravity, Gemini CLI, Android Studio, Cursor, GitHub, JetBrains, Manus y Cline, entre otros
- Cline implementó funciones de generación autónoma de código dentro del IDE usando Gemini 3
El modelo también mejora su capacidad para mantener el contexto en tareas de código de largo plazo, como refactorización multifile, depuración e implementación de funciones

Google Antigravity es una plataforma de desarrollo orientada a agentes basada en Gemini 3, donde los desarrolladores gestionan varios agentes para ejecutar tareas
- Ofrece un entorno colaborativo de agentes inteligentes que operan de manera autónoma en el editor, la terminal y el navegador
El desarrollador asume el rol de diseñador, mientras los agentes realizan implementación de funciones, iteración de UI, corrección de bugs, investigación y generación de reportes
La preview pública para MacOS, Windows y Linux está disponible como descarga gratuita

Mediante la herramienta bash del lado del cliente, el modelo puede sugerir comandos de shell y automatizar tareas del sistema
La herramienta bash del lado del servidor admite generación de código en varios lenguajes y prototipado seguro
La integración de datos basada en Google Search (Grounding) y la función URL context pueden combinarse con salidas estructuradas
- Esto permite usar los datos recolectados y extraídos en tareas posteriores de agentes

Gemini 3 Pro ofrece la función de vibe coding, que genera apps usando solo lenguaje natural
- Gracias a una mejor comprensión de instrucciones complejas y al uso de herramientas, puede crear una app interactiva completa con un solo prompt
Registró una puntuación de 1487 Elo en el leaderboard de WebDev Arena
También mejora el rendimiento en flujos de trabajo de UI/frontend dentro de la plataforma de desarrollo de apps full-stack de Emergent
En Google AI Studio, es posible crear juegos y apps a partir de notas de voz o bocetos
- El modo “Build mode” conecta automáticamente el modelo y la API para agregar funciones de IA con rapidez

Gemini 3 logró el mejor rendimiento en MMMU-Pro y Video MMMU
- Establece una nueva referencia en razonamiento sobre imágenes y videos complejos
Su ventana de contexto de 1 millón de tokens mejora la eficiencia al desarrollar aplicaciones multimodales
Es posible ajustar con precisión la resolución visual (media resolution) para controlar la latencia y el costo

Va más allá del OCR simple y permite comprensión y razonamiento sobre documentos
Incluye una app de demostración que transforma entradas de imagen en una experiencia web interactiva

Mejora sus capacidades de comprensión espacial en tareas como señalamiento, predicción de trayectorias y seguimiento del progreso de tareas
- Puede aplicarse en conducción autónoma, XR y robótica, entre otros campos
También mejora en comprensión de pantalla y reconocimiento del comportamiento del usuario en entornos de escritorio y móviles
- Puede inferir la intención del usuario a partir del movimiento del mouse y anotaciones

Su comprensión de alta tasa de cuadros le permite captar detalles incluso en escenas rápidas
Gracias a la memoria de contexto de largo plazo, puede estructurar narrativas y extraer detalles de videos de varias horas
En el entorno Agent Opus, mejoró la velocidad en 32% y también la precisión y confiabilidad al ejecutar instrucciones complejas

Puede integrarse de inmediato en aplicaciones mediante la Gemini API
- Se añadieron nuevos parámetros como thinking level, media resolution y thought signatures
Es compatible con arquitecturas orientadas a agentes en Gemini CLI, la app de Android y Google Antigravity, entre otros
Con el “Build mode” de Google AI Studio, se pueden crear apps con un solo prompt
- La función “I’m feeling lucky” automatiza la implementación de código creativo

Gemini 3 Pro marca un punto de inflexión en los entornos de desarrollo centrados en IA, al integrarse en flujos de trabajo existentes y proponer nuevas formas de desarrollo
Google ofrece a los desarrolladores herramientas para expandir los límites de lo que es posible con IA
Con esto arranca la era de Gemini 3, y se espera que los desarrolladores la aprovechen para crear nuevas innovaciones

iolothebard 2025-11-26

¡¡Trae la función de vibe coding!! jajaja

GN⁺ 2025-11-19