- Gemini 3 Pro es el modelo de IA más reciente presentado por Google, con mejores capacidades de razonamiento y rendimiento en programación que la versión anterior
- Es compatible con un entorno de desarrollo orientado a agentes y puede usarse en diversas plataformas como Google AI Studio, Vertex AI y Antigravity
- Con la función de “vibe coding”, que crea apps solo con lenguaje natural, es posible producir una aplicación completa con un solo prompt
- Se reforzaron las capacidades de comprensión multimodal, razonamiento visual, espacial y de video, ampliando su utilidad en imágenes complejas, videos y tareas de UI
- Al integrarse en todo el flujo de trabajo del desarrollador, se perfila como un nuevo estándar para el desarrollo de software impulsado por IA
Resumen de Gemini 3 Pro
- Gemini 3 Pro es el modelo más inteligente de Google y supera a la versión anterior en los principales benchmarks de IA
- Frente a 2.5 Pro, mejora el rendimiento de programación y la capacidad para resolver tareas de zero-shot
- Se integra de forma natural con flujos de trabajo orientados a agentes y con entornos de programación existentes, habilitando nuevos casos de uso
- La política de precios es de 2 dólares por cada millón de tokens de entrada y 12 dólares por cada millón de tokens de salida (para prompts de hasta 200k tokens)
- La versión preview está disponible en Google AI Studio y Vertex AI, y parte de la oferta se puede usar gratis
Programación orientada a agentes (Agentic Coding)
- Gemini 3 Pro obtuvo 54.2% en Terminal-Bench 2.0, demostrando su capacidad para usar herramientas basadas en terminal
- Se integra con Google Antigravity, Gemini CLI, Android Studio, Cursor, GitHub, JetBrains, Manus y Cline, entre otros
- Cline implementó funciones de generación autónoma de código dentro del IDE usando Gemini 3
- El modelo también mejora su capacidad para mantener el contexto en tareas de código de largo plazo, como refactorización multifile, depuración e implementación de funciones
Plataforma Google Antigravity
- Google Antigravity es una plataforma de desarrollo orientada a agentes basada en Gemini 3, donde los desarrolladores gestionan varios agentes para ejecutar tareas
- Ofrece un entorno colaborativo de agentes inteligentes que operan de manera autónoma en el editor, la terminal y el navegador
- El desarrollador asume el rol de diseñador, mientras los agentes realizan implementación de funciones, iteración de UI, corrección de bugs, investigación y generación de reportes
- La preview pública para MacOS, Windows y Linux está disponible como descarga gratuita
Gemini API
- Mediante la herramienta bash del lado del cliente, el modelo puede sugerir comandos de shell y automatizar tareas del sistema
- La herramienta bash del lado del servidor admite generación de código en varios lenguajes y prototipado seguro
- La integración de datos basada en Google Search (Grounding) y la función URL context pueden combinarse con salidas estructuradas
- Esto permite usar los datos recolectados y extraídos en tareas posteriores de agentes
Vibe Coding
- Gemini 3 Pro ofrece la función de vibe coding, que genera apps usando solo lenguaje natural
- Gracias a una mejor comprensión de instrucciones complejas y al uso de herramientas, puede crear una app interactiva completa con un solo prompt
- Registró una puntuación de 1487 Elo en el leaderboard de WebDev Arena
- También mejora el rendimiento en flujos de trabajo de UI/frontend dentro de la plataforma de desarrollo de apps full-stack de Emergent
- En Google AI Studio, es posible crear juegos y apps a partir de notas de voz o bocetos
- El modo “Build mode” conecta automáticamente el modelo y la API para agregar funciones de IA con rapidez
Comprensión multimodal (Multimodal Understanding)
- Gemini 3 logró el mejor rendimiento en MMMU-Pro y Video MMMU
- Establece una nueva referencia en razonamiento sobre imágenes y videos complejos
- Su ventana de contexto de 1 millón de tokens mejora la eficiencia al desarrollar aplicaciones multimodales
- Es posible ajustar con precisión la resolución visual (
media resolution) para controlar la latencia y el costo
Razonamiento visual (Visual Reasoning)
- Va más allá del OCR simple y permite comprensión y razonamiento sobre documentos
- Incluye una app de demostración que transforma entradas de imagen en una experiencia web interactiva
Razonamiento espacial (Spatial Reasoning)
- Mejora sus capacidades de comprensión espacial en tareas como señalamiento, predicción de trayectorias y seguimiento del progreso de tareas
- Puede aplicarse en conducción autónoma, XR y robótica, entre otros campos
- También mejora en comprensión de pantalla y reconocimiento del comportamiento del usuario en entornos de escritorio y móviles
- Puede inferir la intención del usuario a partir del movimiento del mouse y anotaciones
Razonamiento en video (Video Reasoning)
- Su comprensión de alta tasa de cuadros le permite captar detalles incluso en escenas rápidas
- Gracias a la memoria de contexto de largo plazo, puede estructurar narrativas y extraer detalles de videos de varias horas
- En el entorno Agent Opus, mejoró la velocidad en 32% y también la precisión y confiabilidad al ejecutar instrucciones complejas
Integración y uso para desarrolladores
- Puede integrarse de inmediato en aplicaciones mediante la Gemini API
- Se añadieron nuevos parámetros como thinking level, media resolution y thought signatures
- Es compatible con arquitecturas orientadas a agentes en Gemini CLI, la app de Android y Google Antigravity, entre otros
- Con el “Build mode” de Google AI Studio, se pueden crear apps con un solo prompt
- La función “I’m feeling lucky” automatiza la implementación de código creativo
Conclusión
- Gemini 3 Pro marca un punto de inflexión en los entornos de desarrollo centrados en IA, al integrarse en flujos de trabajo existentes y proponer nuevas formas de desarrollo
- Google ofrece a los desarrolladores herramientas para expandir los límites de lo que es posible con IA
- Con esto arranca la era de Gemini 3, y se espera que los desarrolladores la aprovechen para crear nuevas innovaciones
2 comentarios
¡¡Trae la función de vibe coding!! jajaja
Comentarios en Hacker News