Todo lo anunciado en Google I/O 2026

xguru · 2026-05-21T11:01:01+09:00

Los ejes principales son Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play y las capacidades de los desarrolladores en la era de la IA Google puso al frente no solo el anuncio de modelos, sino también un flujo de desarrollo donde los agentes acceden a productos reales, el navegador, la nube, apps móviles, datos, documentos y entornos de prueba Las herramientas de desarrollo ya no se limitan a escribir código, sino que se expanden a planificación, ejecución, verificación, depuración, despliegue, evaluación y coordinación de múltiples agentes Android, Flutter, Chrome, Firebase y Google Play se expanden integrando Gemini y herramientas de agentes dentro del flujo de desarrollo existente Más que escribir código, el costo de validación, la provisión de contexto, los permisos de acceso a herramientas, la observabilidad en runtime, la infraestructura de pruebas y la documentación y diseño de sistemas de la organización están surgiendo como cuellos de botella mayores Sesión 1 - Google keynote Cada mes, más de 8.5 millones de personas crean apps y experiencias con modelos de Google Las API de modelos de Google procesan alrededor de 19 mil millones de tokens por minuto Uso de AI Search: AI Overviews es usado por más de 2.5 mil millones de personas al mes AI Mode es usado por más de mil millones de personas al mes Los usuarios activos mensuales de la app de Gemini crecieron de 400 millones en el I/O del año pasado a más de 900 millones Con el modelo Nano Banana se han generado más de 50 mil millones de imágenes Gemini 3.5 Flash está disponible en productos y API, y sus características clave son la ejecución rápida y la eficiencia en costos Gemini Omni Flash es el primer modelo de la familia Omni, orientado a manejar de forma más amplia entradas y salidas multimodales Antigravity 2.0 es una app de escritorio independiente disponible globalmente, que reúne en una sola pantalla conversaciones con agentes, proyectos y gestión de tareas Gran demo de Antigravity: Con 93 subagentes, más de 15,000 solicitudes al modelo y 2.6 mil millones de tokens, construyó el núcleo de un sistema operativo funcional desde un proyecto vacío Se ejecutó con menos de 1,000 dólares en créditos de API aprovechando el rendimiento y la eficiencia en costos de Gemini 3.5 Flash Sesión 2 - Developer keynote Google presentó para desarrolladores un flujo que combina modelos, herramientas de agentes, plataformas para usuarios e infraestructura Managed agents llega a la Gemini API, permitiendo usar en forma de API un agent harness como Antigravity Google Antigravity 2.0 es una app de escritorio centrada en agentes, con una estructura donde múltiples agentes se encargan del trabajo de desarrollo Con el Antigravity SDK se pueden personalizar y desplegar directamente flujos de agentes En Google AI Studio, los nuevos usuarios pueden desplegar directamente en Cloud Run sin tarjeta de crédito Con la integración con Google Workspace, AI Studio puede usar datos de Workspace dentro del flujo de creación de apps En Google AI Studio ahora es posible convertir una idea directamente en una app de Android Gemma 4: Se ofrece bajo licencia Apache 2 Alcanzó 100 millones de descargas en el primer mes Las descargas totales de Gemma superaron 500 millones Chrome DevTools for Agents se puede usar en Antigravity y en más de 20 agentes de programación Gemma 4 se ajustó finamente con LoRA para generar respuestas de comandos bash listas para usarse en un pipeline de CI y desplegarse en una laptop local Sesión 3 - Agent-first workflows from prompt to production Después de desplegar apps creadas en AI Studio con Cloud Run y Firebase, el flujo con agentes se conecta también con la depuración y el análisis en operación A través de más de 50 servidores MCP administrados, los agentes acceden a herramientas y datos de Google Cloud Developer Knowledge MCP incorpora a las herramientas de agentes información actualizada basada en la documentación de Google para reducir problemas por documentación desactualizada Los snapshots de la documentación más reciente llegan a las herramientas de agentes aproximadamente cada 8 a 12 horas Con Data Agent Kit y BigQuery MCP, se analizan datos de Firestore, BigQuery y logs, y se crean dashboards Antigravity puede investigar errores de una app, encontrar archivos relacionados, corregirlos e incluso continuar hasta un commit en GitHub Un remediation agent y un CI agent desplegados en Cloud Run se conectan con Eventarc, Pub/Sub y Gemini para investigar y corregir errores Varios agentes se pasan tareas entre sí mediante A2A (agent-to-agent) El desarrollo con agentes no termina en la creación de prototipos, sino que se extiende a despliegue, monitoreo, análisis de datos y recuperación automática Sesión 4 - What’s new in Android Android 17 agrega límites de memoria y herramientas relacionadas para evitar que el uso excesivo de memoria de una app arruine la experiencia del usuario Android 17 toma condiciones como excessive memory, cold start y excessive CPU como objetivos de análisis automático Las apps dirigidas a Android 17 necesitan el permiso ACCESS_LOCAL_NETWORK para encontrar y conectarse a dispositivos de red local Google refuerza su dirección de construir la UI de Android con Jetpack Compose Compose 1.10 y Compose 1.11 incluyen mejoras de rendimiento, hybrid UI y nuevas API La integración de AppFunctions con Gemini está en vista previa privada, y las apps pueden convertirse en objetivos de orquestación de Gemini La developer preview de ML Kit Prompt API permite probar algunas funciones nuevas Android 17 ofrece Eclipsa Video, mejoras en la calidad de voz HE-AAC y mejoras de cámara y medios basadas en CameraX y Media3 Las apps para pantallas grandes avanzan hacia un enfoque menos atado a las limitaciones móviles tradicionales usando Navigation 3 y la biblioteca Compose Adaptive Compose 1.6 para Wear OS admite Navigation 3 y mode manager para ayudar con la gestión de contenido en modo de ahorro de energía Sesión 5 - What’s new in Chrome Chrome se enfoca en lograr que los sitios web funcionen bien para usuarios que usan agentes y herramientas de tipo agente Busca conectar las herramientas de desarrollo con Baseline y funciones web actualizadas, en lugar de depender solo del conocimiento base del modelo Desde el año pasado, 55 funciones pasaron al estado Baseline Widely Available Al momento del anuncio, 52 funciones estaban en estado Baseline Newly Available Como Chrome se actualiza cada 4 semanas, si los agentes de programación no conocen las funciones web más recientes, es fácil que produzcan implementaciones obsoletas La Prompt API de Chrome estará disponible en Chrome 148 Navigation API, View Transitions, HTML-in-Canvas y declarative partial updates se incorporan al flujo de desarrollo Los desarrolladores de extensiones de Chrome ahora pueden inspeccionar y depurar automáticamente la instalación, service worker, side panel y popup Chrome se expande para ofrecer a los agentes habilidades de alto nivel sobre rendimiento web, identity, security y más de 100 guías de casos de uso comunes Para reducir la repetición de patrones de compatibilidad obsoletos, es necesario proporcionar a los agentes información sobre funciones web recientes y soporte del navegador Sesión 6 - What’s new in Google AI La familia de modelos Gemini es una familia de modelos multimodales capaz de manejar entradas de texto, imagen, audio, video y código, además de múltiples formatos de salida Roles de Gemini 3.5 Pro y Flash: Gemini 3.5 Pro se enfoca en resolver problemas complejos Gemini 3.5 Flash se encarga del equilibrio entre rendimiento, velocidad y costo La función Build de AI Studio usa 3.5 Flash como modelo predeterminado Nano Banana 2 se puede probar directamente en AI Studio Gemini Omni Flash es un modelo capaz de generar salidas, incluido video, a partir de entradas Gemini Live y Live API admiten interacciones basadas en voz Interactions API es una función para interactuar con agentes dentro de AI Studio Accesibilidad de Gemma 4: Se puede probar en el playground de AI Studio También permite algunas llamadas gratuitas en la Gemini API Tiene una ventana de contexto de 256,000 tokens y se puede encontrar en Hugging Face También se presentaron Gemini Robotics 1.6, Genie 3, Antigravity 2.0 y una estrategia para reducir costos combinando modelos abiertos y modelos propietarios Sesión 7 - Build next-gen AI experiences with Google AI Studio and Google Antigravity Google AI Studio se expandió más allá del model playground para convertirse en un espacio donde crear ideas de apps y desplegarlas Modelos, agentes, generación de apps, integración con Workspace y despliegue en Cloud Run forman parte de un mismo flujo La sección de apps de AI Studio estará disponible pronto y abordará de forma más directa la creación y el despliegue de apps Se agregó una función para exportar de una vez a Antigravity el código creado en AI Studio Antigravity 2.0 no solo escribe código, también asume el papel de mission control para coordinar múltiples tareas como agente Antigravity 2.0 tiene como flujo principal la task list, el implementation plan y la revisión de archivos modificados Las revisiones de código y de cambios se pueden gestionar directamente dentro de Antigravity 2.0 La estructura está pensada para delegar al agente tareas pesadas como pruebas en navegador, planificación, desarrollo de funciones en múltiples archivos y verificación end-to-end Con Google AI Studio se puede crear una nueva app de negocio en unos 20 minutos y luego desarrollarla más con Antigravity Google AI Studio es el punto de arranque rápido de “prompt to app”, y Antigravity es la herramienta para llevar esa app a trabajo de desarrollo real Sesión 8 - Unlock modern web capabilities in your AI coding workflows Si un agente de codificación no conoce las capacidades web modernas, es fácil que genere código con criterios de compatibilidad de navegadores desactualizados Chrome lanzó 50 funciones nuevas en el último año, pero por el knowledge cutoff de los modelos muchas de ellas no llegan a los modelos En el ejemplo de Interest Invokers API aparece el problema de que el agente usa el nombre de atributo antiguo interesttarget Modern Web Guidance es un paquete de conocimiento que ayuda a los agentes a encontrar funciones web modernas y las implementaciones recomendadas Antes de responder, el agente realiza una búsqueda semántica dentro de un paquete local Escala y estructura de la guía: Actualmente hay más de 100 guías La estructura permite no exponer todas las skill por función como herramientas de nivel superior, sino encontrarlas y usarlas cuando se necesitan Las guías ofrecen tanto la implementación moderna ideal como recomendaciones de fallback Si no hay requisitos de compatibilidad entre navegadores, el agente toma Baseline Widely Available como supuesto predeterminado Si en AGENTS.md se especifican condiciones como “solo compatible con Chrome 144 o superior”, el agente puede evitar fallback innecesarios El equipo de Chrome ejecuta evaluaciones todos los días con modelos como Gemini 3.1, Claude Opus 4.7 y GPT 5.5 Sesión 9 - What’s new in Firebase Firebase está migrando hacia una agent-native platform donde tanto personas como agentes pueden crear y escalar apps Firebase Data Connect evolucionó a Firebase SQL Connect, que respalda el desarrollo de apps basado en SQL Con los custom resolver de Firebase SQL Connect se pueden conectar servicios de Google Cloud como Cloud Functions y BigQuery Firestore admite geo search, native full text search y semantic match Firebase AI Logic es compatible con los modelos más recientes y permite crear funciones de IA con reconocimiento de ubicación mediante Maps grounding Las funciones de control de generación de imágenes de Nano Banana también se pueden usar en Firebase AI Logic Firebase AI Logic admite inferencia local e híbrida en iOS, Chrome y Android, y hace fallback a un cloud-hosted model cuando no hay modelo local Dart support for Cloud Functions in Firebase está disponible como experimental preview AI Studio está conectado con Google Workspace, por lo que los datos de Sheets, Docs, Gmail y Calendar pueden usarse en apps Firebase agent skills se puede usar en Android, iOS, web y Flutter, y también se amplió la compatibilidad con Crashlytics Sesión 10 - What’s new in Google Play Play Billing admite más de 300 métodos de pago locales en más de 65 mercados Google Play tiene más de 890 millones de usuarios listos para comprar Se amplían las opciones para ofrecer Google Play Billing junto con pagos alternativos, y también se anunciaron comisiones de servicio más bajas El descubrimiento de apps se expande a la app de Gemini, Android y la web, para que los usuarios puedan encontrar apps y juegos dentro de Gemini En lugar de una lista estática de enlaces, Gemini recomienda apps usando las funciones reales de la app y la información del store listing En algunos temas, los usuarios de Gemini y Play pueden explorar más de 450,000 contenidos de películas y TV En Play Console, si se suben archivos estructurados como Eclipsa Video o Google Sheets, Gemini completa previamente el listing Gemini ayudará con tareas de Play Console como bulk price changes, import skills y metadata configuration Con la in-app subscription management API, los usuarios podrán cambiar fácilmente de plan de suscripción dentro de la app El año pasado, Google Play Billing bloqueó 3,400 millones de dólares en intentos de fraude y 130 millones de dólares en abusive refunds Sesión 11 - Defining the agentic AI era Gemini, Search, la app de Gemini y Google DeepMind abordan la IA agéntica en una misma dirección Gemini 3.5 Flash también puede usarse dentro de Search Search debe encontrar el equilibrio entre respuestas rápidas y tareas agénticas más largas Gemini Spark asume el rol de un agente always-on que se encarga en segundo plano de las tareas que el usuario le deja El modelo debe ir más allá de simples respuestas de chat y operar sobre todo el conjunto de productos de Google y el ecosistema externo Herramienta interna traducida de Python a Go: Traducir a otro lenguaje un programa existente con pruebas es un problema más claro para el modelo Algunas herramientas internas se volvieron 10-20 veces más rápidas de la noche a la mañana La infraestructura interna de software de Google también puede cambiar más rápido para adaptarse al nuevo mundo agéntico El hardware, la escala de los modelos, la aplicación en productos y el ciclo de retroalimentación deben encajar juntos para que Gemini pueda integrarse en todos los productos de Google El foco de las preguntas se desplaza de “qué puede hacer el modelo” a “cómo ubicar el modelo dentro de productos y flujos de trabajo” Sesión 12 - What’s new in Android development tools Las herramientas de desarrollo de Android están diseñadas pensando no solo en desarrolladores humanos, sino también en agentes de IA desplegados dentro de la base de código Android Studio Otter es compatible con cuentas de Gemini Enterprise y Google One Android Studio puede importar y usar modelos locales y remotos Android Bench sirve como criterio para decidir qué modelo usar en tareas de desarrollo de Android Se pueden pedir transformaciones de UI directamente desde Compose Preview para que el agente trabaje con mejor contexto Se puede usar un agent-based new project wizard para crear una app Android adaptativa solo con prompts Android Studio incluye alrededor de 10 skills para ayudar con tareas como la integración de APIs adaptativas y la conversión de XML a Compose El nuevo Android CLI admite flujos de trabajo con LLM y, al crear proyectos nuevos, reduce el uso de tokens en más del 70% frente a otras herramientas LLM para Gradle Al agrupar Antigravity CLI, Android CLI y Android skill, también se puede empezar a desarrollar apps Android desde Antigravity En Android Studio Quail y en dispositivos con Android 17, la conexión con el dispositivo se mantiene incluso si cambias de red o reinicias la laptop Sesión 13 - What’s new in Flutter Flutter 3.44 y Dart 3.12 se lanzan juntos Este año participaron más de 1,700 contributors en el proyecto Flutter Cada mes, más de 1.5 millones de desarrolladores construyen con Flutter En Flutter 3.44 se puede probar un nuevo modo de renderizado en dispositivos Android compatibles con Vulkan y API 34 o superior Flutter se usa en el sistema de infoentretenimiento del Toyota RAV4 2026 En Cloud Functions for Firebase basadas en Dart, hay casos donde el cold start baja hasta 10 ms gracias a la compilación AOT Firebase AI Logic añade plantillas de prompts en el servidor, para no tener que incluir los prompts directamente en la app Firebase Agent Skills for Flutter proporciona a los agentes guías para crear apps full-stack con Flutter y Firebase El soporte de LiteRT-LM llegará pronto al paquete flutter_gemma En Flutter desktop, Canonical participa como lead maintainer y strategic steward Sesión 14 - What’s new in the Gemma open model family Gemma 4 se consolida como el modelo abierto más potente de la familia Gemma Está disponible en varios tamaños, de 2B a 31B, para usarse en móviles, laptops y la nube Gemma comenzó en 2024 como una familia de modelos que iba de 1B a 27B Gemma 4 es un modelo de pesos abiertos y compatible con el ecosistema open source Con MTP y speculative decoding, la velocidad de decodificación puede aumentar hasta 3 veces El ecosistema Android ya cuenta con una implementación day-zero de Gemma 4 A través de la API de Android, se pueden ejecutar directamente modelos pequeños de Gemma en el teléfono o desarrollar apps Android con un modelo Gemma local en entornos donde el acceso a la API de Gemini es difícil Usan el ADK (agent development kit) sobre Cloud Run y Gemma 31B para crear agentes que entienden bases de datos y encuentran respuestas Gemma 4 puede ejecutarse en el navegador o en entornos locales mediante las interfaces compatibles con OpenAI de Transformers.js, Ollama y LM Studio La nube empresarial, las máquinas locales, el navegador y los móviles pasan a ser entornos de ejecución para Gemma Sesión 15 - What’s new in Web UI La actualización de Web UI de 2026 presenta las funciones principales junto con su estado en Baseline Todas las funciones llevan indicadores de compatibilidad como Baseline Widely Available, Newly Available o Limited Available Con la contrast-color API es más fácil elegir en CSS colores con el contraste adecuado La función meta name="text-scale" de Chrome 146 responde a la configuración de tamaño de texto del sistema Más del 30% de los usuarios de Android y iOS cambian el tamaño de texto predeterminado Desde Chrome 134, el elemento dialog incorpora funciones del popover como declarative light dismiss Las two-phase View Transitions pueden probarse en Chrome Canary Las scroll-driven animations llegaron a Chrome en 2023, y con Interop 2026 mejoran su interoperabilidad La HTML-in-Canvas API permite insertar contenido DOM real dentro de Canvas En Chrome 149 se añaden nuevos usos para gap decorations y shape outside Sesión 16 - Adaptive development for the expanding Android ecosystem Android ya no es un ecosistema exclusivo de teléfonos, y más de 580 millones de dispositivos activos de pantalla grande se benefician de la inversión en apps adaptativas Los usuarios de foldables se clasifican como un segmento de mayor valor en las apps adaptativas En Android 17, se avanza hacia eliminar el opt-out de orientation y resizability para los objetivos con target SDK 37 El Desktop emulator de Android Studio Quail Canary permite probar apps de Android en formato de escritorio Con la Continue On API de Android 17, los usuarios pueden continuar en un segundo dispositivo lo que estaban haciendo en otro Google está reforzando la tendencia de crear apps de Android con un enfoque Compose-first Compose 1.11 mejora el soporte de trackpad al nivel de mouse y pointer, y añade una API de testing para entradas no táctiles Compose añade una API experimental para state-based styling Connected Displays se ofrece públicamente a través de Android Feature Drop Las bibliotecas Compose, Navigation 3 y Compose Adaptive responden a múltiples pantallas como foldables, desktop, auto, TV y XR Sesión 17 - Building the quantum-AI future with Hartmut Neven and James Manyika El tema central es cómo la computación cuántica y la IA se aceleran mutuamente Hartmut Neven inició el equipo de Quantum AI de Google en 2012 superposition y qubit son la base de la computación cuántica La cantidad de bit strings posibles en un chip de 105 qubits es 2 elevado a 105 La comunidad ya ha identificado más de 70 algoritmos y problemas que una computadora cuántica puede resolver de forma útil En el futuro, esa cifra podría multiplicarse por más de 10 quantum error correction es una tecnología clave para mantener el estado de superposición Google logró en 2022 reducir errores en máquinas reales mediante quantum error correction Quantum Echoes se vincula con la forma de aprender a partir de datos generados por NMR o MRI Google plantea que la transición hacia post-quantum cryptography debe avanzar con mayor solidez de aquí a 2029 Sesión 18 - Scale AI with Google’s TPU software stack Trata sobre una pila de software open source para entrenar, ajustar finamente e inferir modelos sobre TPU El flujo de desarrollo de modelos se divide en pre-training, post-training y serving/inference Se puede probar post-training e inference con las TPU gratuitas de Kaggle y Colab La demo de vLLM on TPU ejecuta el modelo Gemma 4 31B en TPU y resume información nutricional a partir de imágenes de comida Gemma 4 es un modelo multimodal adecuado para recibir imágenes, entender su contenido y resumirlo Al incorporar MTP en vLLM TPU inference, se obtuvo una mejora de velocidad de alrededor de 3 veces en varias tareas Tunix es un framework ligero para post-training En lugar de un modelo grande, se ajusta finamente un modelo de 4B para realizar la misma tarea y ejecutarlo en un solo chip Trillium MaxText, Tunix, vLLM, JAX, PyTorch y TPU se ubican como herramientas a lo largo del ciclo de vida del modelo Sesión 19 - Supercharge your AI coding workflow with Chrome DevTools for agents Chrome DevTools for agents es una herramienta que permite a los agentes de programación observar directamente el runtime del navegador a través de DevTools Así como los desarrolladores humanos aprenden y depuran con DevTools, los agentes de programación también deben tener el mismo ciclo cerrado de retroalimentación Los agentes pueden abrir una instancia real de Chrome, navegar por páginas, llenar formularios y recopilar console log y network request Gracias al acceso a source maps, pueden saltar de un problema en runtime al archivo fuente relacionado La herramienta se ofrece como NPM package e incluye MCP server y CLI Seis skills disponibles: troubleshooting, Chrome DevTools y Chrome DevTools CLI skill ayudan con el uso general y los conceptos accessibility debugging, memory leak debugging y optimized LCP skill incorporan conocimiento especializado al agente La implementación se basa en Puppeteer, y los agentes usan un wrapper de la herramienta en lugar de usar Puppeteer directamente De forma predeterminada, usa un perfil de navegador anónimo independiente y no accede al Chrome password manager CyberAgent auditó 236 stories de Storybook de 32 componentes en menos de una hora con DevTools for agents Sesión 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis Demis Hassabis definió el objetivo original de DeepMind como “solve intelligence” El tema central es cómo la IA está transformando el descubrimiento científico, los productos y las herramientas de investigación AlphaFold vuelve a citarse como un caso que resolvió un problema de 50 años sobre la estructura de las proteínas Gemini for Science se conecta con la línea de modelos científicos presentada en la keynote Demis Hassabis describe este momento como estar en las “foothills” de la singularidad, y sitúa la resolución de la inteligencia alrededor de 2030, con un margen de un año Los modelos de la familia Genie se usan para que Waymo pruebe situaciones 1 in a billion que son difíciles de ver en el mundo real Los avances de Isomorphic Labs en drug discovery se presentan como un ejemplo de cómo la IA acelera la ciencia La app de Gemini tiene 900 millones de usuarios mensuales, y AI Mode in Search también se ha convertido en una superficie clave de producto La IA se usa no solo como funcionalidad de producto, sino como herramienta para resolver problemas científicos y de investigación Sesión 21 - A fireside chat on the evolution of the developer craft En la era de la IA, el trabajo del desarrollador se desplaza de escribir código hacia diseño de sistemas, documentación y orquestación Aunque siguen apareciendo nuevas herramientas y modelos, no es necesario seguir todas las tendencias de inmediato; hay que elegir de forma intencional qué herramientas aprender Incorporar agentes al equipo se parece a sumar varios ingenieros junior, por lo que la documentación interna y el registro de decisiones de diseño se vuelven más importantes Para crear un buen agentic workflow, hay que definir la responsabilidad de cada agente, cómo conversan varios agentes entre sí y en qué punto supervisa la persona La UX de varias herramientas de programación se está pareciendo, así que los patrones aprendidos en una herramienta pueden trasladarse a otras Al trabajar con agentes, hay que soltar parte del control del proceso y centrarse en alinear los resultados y la intención de diseño La technical debt, cognitive debt e intent debt pueden mejorar más rápido o empeorar más rápido con la IA Ejecutar 20 agentes al mismo tiempo puede superar la capacidad cognitiva humana, por lo que hay que gestionarlo de forma intencional Los buenos hábitos de prompting cambian de fragmentos de búsqueda a formular objetivos completos con contexto Más importante que “si escribes todo el código tú mismo” es “si cuentas con el contexto y el sistema de verificación para que el agente pueda trabajar” Sesión 22 - Build core skills to thrive as an AI-era developer Incluso en la era de la IA, las capacidades básicas de ingeniería de software se vuelven aún más importantes La IA puede ser un force multiplier, pero se necesita experiencia profunda para evaluar, integrar y mantener sus resultados Cuanto más autónomos sean los agentes, más se necesita un enfoque shift-left para aclarar la intención desde etapas más tempranas El diseño de sistemas se amplía hasta incluir entorno, personas, agentes, herramientas y cultura En lugar de usar agentes listos para usar, los equipos deben crear y mantener directamente el rol, perfil, receta, regla y habilidad de cada agente Las specs, reglas de agentes y habilidades se convierten en la source of truth que transmite a los agentes el qué y el porqué del sistema Para crear una evaluación realista, se necesitan en conjunto capacidades de IA, ingeniería de software, usuarios y negocio Hay que crear un ciclo de retroalimentación que analice el agent trace para mejorar la usabilidad de las herramientas, las habilidades del agente y el diseño del sistema Los ingenieros humanos pasan de ser el conductor de un agente individual a ser el orchestrator de varios equipos de agentes asíncronos Para ver el sistema desde la perspectiva de actores maliciosos, se puede asignar explícitamente un agente de red team Sesión 23 - Software engineering at the tipping point Si la IA acelera la escritura de código, todo el ecosistema de desarrollo recibe presión a nivel de software ecology En Google, todo el código, incluido Android y Chrome, está en un monorepo compartido y se confirma en el trunk Desde hace mucho tiempo, Google usa herramientas internas con las que un solo desarrollador puede modificar millones de líneas de código Es muy probable que el ecosistema de desarrollo actual no pueda soportar una velocidad 10 veces mayor Si los agentes generan más compilaciones, pruebas, commits y uso de tokens, aumentan los costos de infraestructura y los cuellos de botella Los agentes pueden crear código fácil de escribir, pero no necesariamente código fácil de mantener para las personas Se necesitan habilidades agentic de component reuse y component isolation que impongan reutilización y aislamiento El acceso a APIs y datos debe protegerse con solidez, como si en la práctica estuviera expuesto a los agentes La frase “agents will find things you probably didn't want them to” deja en evidencia los riesgos del diseño de permisos En el ecosistema de desarrollo de 2030, la forma actual de trabajar podría parecer tan anticuada como la era del CD-ROM de 2001 Sesión 24 - Vibe once, run anywhere with Google Antigravity and Flutter Si se usan juntos Antigravity y Flutter, una idea creada una sola vez puede expandirse a múltiples plataformas Desde el lanzamiento de Gemini 3, la capacidad del modelo ha aumentado mucho, y Antigravity la ha soportado desde el principio Antigravity se centra en un ciclo de retroalimentación donde planificación, ejecución y verificación están estrechamente conectadas Antigravity crea una lista de tareas y un plan de implementación, deja screenshots y video durante la ejecución, y al terminar redacta un informe con lo implementado y las razones En la etapa de verificación, se encadenan la ejecución de la app, la captura de screenshots, el clic en botones de Chrome y la ejecución de pruebas En Flutter, el tipado fuerte de Dart y el analysis server proporcionan al LLM señales objetivas de error, como firmas de funciones y estructuras de clases Flutter es un cross-platform UI toolkit que ofrece los mismos píxeles y funciones en múltiples pantallas El stateful hot reload de Flutter ofrece una experiencia de desarrollo que vuelve a compilar la app en ejecución en menos de 1 segundo Cuanto más código generen los agentes, más deberán las personas definir los objetivos de diseño y la dirección del producto, y revisar los resultados de los agentes Antigravity proporciona el ciclo de ejecución de agentes, y Flutter ofrece resultados consistentes en múltiples plataformas, creando el flujo “vibe once, run anywhere”

(io.google)

8 puntos por xguru 2026-05-21 | 3 comentarios | Compartir por WhatsApp

Los ejes principales son Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play y las capacidades de los desarrolladores en la era de la IA
Google puso al frente no solo el anuncio de modelos, sino también un flujo de desarrollo donde los agentes acceden a productos reales, el navegador, la nube, apps móviles, datos, documentos y entornos de prueba
Las herramientas de desarrollo ya no se limitan a escribir código, sino que se expanden a planificación, ejecución, verificación, depuración, despliegue, evaluación y coordinación de múltiples agentes
Android, Flutter, Chrome, Firebase y Google Play se expanden integrando Gemini y herramientas de agentes dentro del flujo de desarrollo existente
Más que escribir código, el costo de validación, la provisión de contexto, los permisos de acceso a herramientas, la observabilidad en runtime, la infraestructura de pruebas y la documentación y diseño de sistemas de la organización están surgiendo como cuellos de botella mayores

Sesión 1 - Google keynote

Cada mes, más de 8.5 millones de personas crean apps y experiencias con modelos de Google
Las API de modelos de Google procesan alrededor de 19 mil millones de tokens por minuto
Uso de AI Search:
- AI Overviews es usado por más de 2.5 mil millones de personas al mes
- AI Mode es usado por más de mil millones de personas al mes
Los usuarios activos mensuales de la app de Gemini crecieron de 400 millones en el I/O del año pasado a más de 900 millones
Con el modelo Nano Banana se han generado más de 50 mil millones de imágenes
Gemini 3.5 Flash está disponible en productos y API, y sus características clave son la ejecución rápida y la eficiencia en costos
Gemini Omni Flash es el primer modelo de la familia Omni, orientado a manejar de forma más amplia entradas y salidas multimodales
Antigravity 2.0 es una app de escritorio independiente disponible globalmente, que reúne en una sola pantalla conversaciones con agentes, proyectos y gestión de tareas
Gran demo de Antigravity:
- Con 93 subagentes, más de 15,000 solicitudes al modelo y 2.6 mil millones de tokens, construyó el núcleo de un sistema operativo funcional desde un proyecto vacío
- Se ejecutó con menos de 1,000 dólares en créditos de API aprovechando el rendimiento y la eficiencia en costos de Gemini 3.5 Flash

Sesión 2 - Developer keynote

Google presentó para desarrolladores un flujo que combina modelos, herramientas de agentes, plataformas para usuarios e infraestructura
Managed agents llega a la Gemini API, permitiendo usar en forma de API un agent harness como Antigravity
Google Antigravity 2.0 es una app de escritorio centrada en agentes, con una estructura donde múltiples agentes se encargan del trabajo de desarrollo
Con el Antigravity SDK se pueden personalizar y desplegar directamente flujos de agentes
En Google AI Studio, los nuevos usuarios pueden desplegar directamente en Cloud Run sin tarjeta de crédito
Con la integración con Google Workspace, AI Studio puede usar datos de Workspace dentro del flujo de creación de apps
En Google AI Studio ahora es posible convertir una idea directamente en una app de Android
Gemma 4:
- Se ofrece bajo licencia Apache 2
- Alcanzó 100 millones de descargas en el primer mes
- Las descargas totales de Gemma superaron 500 millones
Chrome DevTools for Agents se puede usar en Antigravity y en más de 20 agentes de programación
Gemma 4 se ajustó finamente con LoRA para generar respuestas de comandos bash listas para usarse en un pipeline de CI y desplegarse en una laptop local

Sesión 3 - Agent-first workflows from prompt to production

Después de desplegar apps creadas en AI Studio con Cloud Run y Firebase, el flujo con agentes se conecta también con la depuración y el análisis en operación
A través de más de 50 servidores MCP administrados, los agentes acceden a herramientas y datos de Google Cloud
Developer Knowledge MCP incorpora a las herramientas de agentes información actualizada basada en la documentación de Google para reducir problemas por documentación desactualizada
Los snapshots de la documentación más reciente llegan a las herramientas de agentes aproximadamente cada 8 a 12 horas
Con Data Agent Kit y BigQuery MCP, se analizan datos de Firestore, BigQuery y logs, y se crean dashboards
Antigravity puede investigar errores de una app, encontrar archivos relacionados, corregirlos e incluso continuar hasta un commit en GitHub
Un remediation agent y un CI agent desplegados en Cloud Run se conectan con Eventarc, Pub/Sub y Gemini para investigar y corregir errores
Varios agentes se pasan tareas entre sí mediante A2A (agent-to-agent)
El desarrollo con agentes no termina en la creación de prototipos, sino que se extiende a despliegue, monitoreo, análisis de datos y recuperación automática

Sesión 4 - What’s new in Android

Android 17 agrega límites de memoria y herramientas relacionadas para evitar que el uso excesivo de memoria de una app arruine la experiencia del usuario
Android 17 toma condiciones como excessive memory, cold start y excessive CPU como objetivos de análisis automático
Las apps dirigidas a Android 17 necesitan el permiso ACCESS_LOCAL_NETWORK para encontrar y conectarse a dispositivos de red local
Google refuerza su dirección de construir la UI de Android con Jetpack Compose
Compose 1.10 y Compose 1.11 incluyen mejoras de rendimiento, hybrid UI y nuevas API
La integración de AppFunctions con Gemini está en vista previa privada, y las apps pueden convertirse en objetivos de orquestación de Gemini
La developer preview de ML Kit Prompt API permite probar algunas funciones nuevas
Android 17 ofrece Eclipsa Video, mejoras en la calidad de voz HE-AAC y mejoras de cámara y medios basadas en CameraX y Media3
Las apps para pantallas grandes avanzan hacia un enfoque menos atado a las limitaciones móviles tradicionales usando Navigation 3 y la biblioteca Compose Adaptive
Compose 1.6 para Wear OS admite Navigation 3 y mode manager para ayudar con la gestión de contenido en modo de ahorro de energía

Sesión 5 - What’s new in Chrome

Chrome se enfoca en lograr que los sitios web funcionen bien para usuarios que usan agentes y herramientas de tipo agente
Busca conectar las herramientas de desarrollo con Baseline y funciones web actualizadas, en lugar de depender solo del conocimiento base del modelo
Desde el año pasado, 55 funciones pasaron al estado Baseline Widely Available
Al momento del anuncio, 52 funciones estaban en estado Baseline Newly Available
Como Chrome se actualiza cada 4 semanas, si los agentes de programación no conocen las funciones web más recientes, es fácil que produzcan implementaciones obsoletas
La Prompt API de Chrome estará disponible en Chrome 148
Navigation API, View Transitions, HTML-in-Canvas y declarative partial updates se incorporan al flujo de desarrollo
Los desarrolladores de extensiones de Chrome ahora pueden inspeccionar y depurar automáticamente la instalación, service worker, side panel y popup
Chrome se expande para ofrecer a los agentes habilidades de alto nivel sobre rendimiento web, identity, security y más de 100 guías de casos de uso comunes
Para reducir la repetición de patrones de compatibilidad obsoletos, es necesario proporcionar a los agentes información sobre funciones web recientes y soporte del navegador

Sesión 6 - What’s new in Google AI

La familia de modelos Gemini es una familia de modelos multimodales capaz de manejar entradas de texto, imagen, audio, video y código, además de múltiples formatos de salida
Roles de Gemini 3.5 Pro y Flash:
- Gemini 3.5 Pro se enfoca en resolver problemas complejos
- Gemini 3.5 Flash se encarga del equilibrio entre rendimiento, velocidad y costo
La función Build de AI Studio usa 3.5 Flash como modelo predeterminado
Nano Banana 2 se puede probar directamente en AI Studio
Gemini Omni Flash es un modelo capaz de generar salidas, incluido video, a partir de entradas
Gemini Live y Live API admiten interacciones basadas en voz
Interactions API es una función para interactuar con agentes dentro de AI Studio
Accesibilidad de Gemma 4:
- Se puede probar en el playground de AI Studio
- También permite algunas llamadas gratuitas en la Gemini API
- Tiene una ventana de contexto de 256,000 tokens y se puede encontrar en Hugging Face
También se presentaron Gemini Robotics 1.6, Genie 3, Antigravity 2.0 y una estrategia para reducir costos combinando modelos abiertos y modelos propietarios

Sesión 7 - Build next-gen AI experiences with Google AI Studio and Google Antigravity

Google AI Studio se expandió más allá del model playground para convertirse en un espacio donde crear ideas de apps y desplegarlas
Modelos, agentes, generación de apps, integración con Workspace y despliegue en Cloud Run forman parte de un mismo flujo
La sección de apps de AI Studio estará disponible pronto y abordará de forma más directa la creación y el despliegue de apps
Se agregó una función para exportar de una vez a Antigravity el código creado en AI Studio
Antigravity 2.0 no solo escribe código, también asume el papel de mission control para coordinar múltiples tareas como agente
Antigravity 2.0 tiene como flujo principal la task list, el implementation plan y la revisión de archivos modificados
Las revisiones de código y de cambios se pueden gestionar directamente dentro de Antigravity 2.0
La estructura está pensada para delegar al agente tareas pesadas como pruebas en navegador, planificación, desarrollo de funciones en múltiples archivos y verificación end-to-end
Con Google AI Studio se puede crear una nueva app de negocio en unos 20 minutos y luego desarrollarla más con Antigravity
Google AI Studio es el punto de arranque rápido de “prompt to app”, y Antigravity es la herramienta para llevar esa app a trabajo de desarrollo real

Sesión 8 - Unlock modern web capabilities in your AI coding workflows

Si un agente de codificación no conoce las capacidades web modernas, es fácil que genere código con criterios de compatibilidad de navegadores desactualizados
Chrome lanzó 50 funciones nuevas en el último año, pero por el knowledge cutoff de los modelos muchas de ellas no llegan a los modelos
En el ejemplo de Interest Invokers API aparece el problema de que el agente usa el nombre de atributo antiguo interesttarget
Modern Web Guidance es un paquete de conocimiento que ayuda a los agentes a encontrar funciones web modernas y las implementaciones recomendadas
Antes de responder, el agente realiza una búsqueda semántica dentro de un paquete local
Escala y estructura de la guía:
- Actualmente hay más de 100 guías
- La estructura permite no exponer todas las skill por función como herramientas de nivel superior, sino encontrarlas y usarlas cuando se necesitan
Las guías ofrecen tanto la implementación moderna ideal como recomendaciones de fallback
Si no hay requisitos de compatibilidad entre navegadores, el agente toma Baseline Widely Available como supuesto predeterminado
Si en AGENTS.md se especifican condiciones como “solo compatible con Chrome 144 o superior”, el agente puede evitar fallback innecesarios
El equipo de Chrome ejecuta evaluaciones todos los días con modelos como Gemini 3.1, Claude Opus 4.7 y GPT 5.5

Sesión 9 - What’s new in Firebase

Firebase está migrando hacia una agent-native platform donde tanto personas como agentes pueden crear y escalar apps
Firebase Data Connect evolucionó a Firebase SQL Connect, que respalda el desarrollo de apps basado en SQL
Con los custom resolver de Firebase SQL Connect se pueden conectar servicios de Google Cloud como Cloud Functions y BigQuery
Firestore admite geo search, native full text search y semantic match
Firebase AI Logic es compatible con los modelos más recientes y permite crear funciones de IA con reconocimiento de ubicación mediante Maps grounding
Las funciones de control de generación de imágenes de Nano Banana también se pueden usar en Firebase AI Logic
Firebase AI Logic admite inferencia local e híbrida en iOS, Chrome y Android, y hace fallback a un cloud-hosted model cuando no hay modelo local
Dart support for Cloud Functions in Firebase está disponible como experimental preview
AI Studio está conectado con Google Workspace, por lo que los datos de Sheets, Docs, Gmail y Calendar pueden usarse en apps
Firebase agent skills se puede usar en Android, iOS, web y Flutter, y también se amplió la compatibilidad con Crashlytics

Sesión 10 - What’s new in Google Play

Play Billing admite más de 300 métodos de pago locales en más de 65 mercados
Google Play tiene más de 890 millones de usuarios listos para comprar
Se amplían las opciones para ofrecer Google Play Billing junto con pagos alternativos, y también se anunciaron comisiones de servicio más bajas
El descubrimiento de apps se expande a la app de Gemini, Android y la web, para que los usuarios puedan encontrar apps y juegos dentro de Gemini
En lugar de una lista estática de enlaces, Gemini recomienda apps usando las funciones reales de la app y la información del store listing
En algunos temas, los usuarios de Gemini y Play pueden explorar más de 450,000 contenidos de películas y TV
En Play Console, si se suben archivos estructurados como Eclipsa Video o Google Sheets, Gemini completa previamente el listing
Gemini ayudará con tareas de Play Console como bulk price changes, import skills y metadata configuration
Con la in-app subscription management API, los usuarios podrán cambiar fácilmente de plan de suscripción dentro de la app
El año pasado, Google Play Billing bloqueó 3,400 millones de dólares en intentos de fraude y 130 millones de dólares en abusive refunds

Sesión 11 - Defining the agentic AI era

Gemini, Search, la app de Gemini y Google DeepMind abordan la IA agéntica en una misma dirección
Gemini 3.5 Flash también puede usarse dentro de Search
Search debe encontrar el equilibrio entre respuestas rápidas y tareas agénticas más largas
Gemini Spark asume el rol de un agente always-on que se encarga en segundo plano de las tareas que el usuario le deja
El modelo debe ir más allá de simples respuestas de chat y operar sobre todo el conjunto de productos de Google y el ecosistema externo
Herramienta interna traducida de Python a Go:
- Traducir a otro lenguaje un programa existente con pruebas es un problema más claro para el modelo
- Algunas herramientas internas se volvieron 10-20 veces más rápidas de la noche a la mañana
La infraestructura interna de software de Google también puede cambiar más rápido para adaptarse al nuevo mundo agéntico
El hardware, la escala de los modelos, la aplicación en productos y el ciclo de retroalimentación deben encajar juntos para que Gemini pueda integrarse en todos los productos de Google
El foco de las preguntas se desplaza de “qué puede hacer el modelo” a “cómo ubicar el modelo dentro de productos y flujos de trabajo”

Sesión 12 - What’s new in Android development tools

Las herramientas de desarrollo de Android están diseñadas pensando no solo en desarrolladores humanos, sino también en agentes de IA desplegados dentro de la base de código
Android Studio Otter es compatible con cuentas de Gemini Enterprise y Google One
Android Studio puede importar y usar modelos locales y remotos
Android Bench sirve como criterio para decidir qué modelo usar en tareas de desarrollo de Android
Se pueden pedir transformaciones de UI directamente desde Compose Preview para que el agente trabaje con mejor contexto
Se puede usar un agent-based new project wizard para crear una app Android adaptativa solo con prompts
Android Studio incluye alrededor de 10 skills para ayudar con tareas como la integración de APIs adaptativas y la conversión de XML a Compose
El nuevo Android CLI admite flujos de trabajo con LLM y, al crear proyectos nuevos, reduce el uso de tokens en más del 70% frente a otras herramientas LLM para Gradle
Al agrupar Antigravity CLI, Android CLI y Android skill, también se puede empezar a desarrollar apps Android desde Antigravity
En Android Studio Quail y en dispositivos con Android 17, la conexión con el dispositivo se mantiene incluso si cambias de red o reinicias la laptop

Sesión 13 - What’s new in Flutter

Flutter 3.44 y Dart 3.12 se lanzan juntos
Este año participaron más de 1,700 contributors en el proyecto Flutter
Cada mes, más de 1.5 millones de desarrolladores construyen con Flutter
En Flutter 3.44 se puede probar un nuevo modo de renderizado en dispositivos Android compatibles con Vulkan y API 34 o superior
Flutter se usa en el sistema de infoentretenimiento del Toyota RAV4 2026
En Cloud Functions for Firebase basadas en Dart, hay casos donde el cold start baja hasta 10 ms gracias a la compilación AOT
Firebase AI Logic añade plantillas de prompts en el servidor, para no tener que incluir los prompts directamente en la app
Firebase Agent Skills for Flutter proporciona a los agentes guías para crear apps full-stack con Flutter y Firebase
El soporte de LiteRT-LM llegará pronto al paquete flutter_gemma
En Flutter desktop, Canonical participa como lead maintainer y strategic steward

Sesión 14 - What’s new in the Gemma open model family

Gemma 4 se consolida como el modelo abierto más potente de la familia Gemma
Está disponible en varios tamaños, de 2B a 31B, para usarse en móviles, laptops y la nube
Gemma comenzó en 2024 como una familia de modelos que iba de 1B a 27B
Gemma 4 es un modelo de pesos abiertos y compatible con el ecosistema open source
Con MTP y speculative decoding, la velocidad de decodificación puede aumentar hasta 3 veces
El ecosistema Android ya cuenta con una implementación day-zero de Gemma 4
A través de la API de Android, se pueden ejecutar directamente modelos pequeños de Gemma en el teléfono o desarrollar apps Android con un modelo Gemma local en entornos donde el acceso a la API de Gemini es difícil
Usan el ADK (agent development kit) sobre Cloud Run y Gemma 31B para crear agentes que entienden bases de datos y encuentran respuestas
Gemma 4 puede ejecutarse en el navegador o en entornos locales mediante las interfaces compatibles con OpenAI de Transformers.js, Ollama y LM Studio
La nube empresarial, las máquinas locales, el navegador y los móviles pasan a ser entornos de ejecución para Gemma

Sesión 15 - What’s new in Web UI

La actualización de Web UI de 2026 presenta las funciones principales junto con su estado en Baseline
Todas las funciones llevan indicadores de compatibilidad como Baseline Widely Available, Newly Available o Limited Available
Con la contrast-color API es más fácil elegir en CSS colores con el contraste adecuado
La función meta name="text-scale" de Chrome 146 responde a la configuración de tamaño de texto del sistema
Más del 30% de los usuarios de Android y iOS cambian el tamaño de texto predeterminado
Desde Chrome 134, el elemento dialog incorpora funciones del popover como declarative light dismiss
Las two-phase View Transitions pueden probarse en Chrome Canary
Las scroll-driven animations llegaron a Chrome en 2023, y con Interop 2026 mejoran su interoperabilidad
La HTML-in-Canvas API permite insertar contenido DOM real dentro de Canvas
En Chrome 149 se añaden nuevos usos para gap decorations y shape outside

Sesión 16 - Adaptive development for the expanding Android ecosystem

Android ya no es un ecosistema exclusivo de teléfonos, y más de 580 millones de dispositivos activos de pantalla grande se benefician de la inversión en apps adaptativas
Los usuarios de foldables se clasifican como un segmento de mayor valor en las apps adaptativas
En Android 17, se avanza hacia eliminar el opt-out de orientation y resizability para los objetivos con target SDK 37
El Desktop emulator de Android Studio Quail Canary permite probar apps de Android en formato de escritorio
Con la Continue On API de Android 17, los usuarios pueden continuar en un segundo dispositivo lo que estaban haciendo en otro
Google está reforzando la tendencia de crear apps de Android con un enfoque Compose-first
Compose 1.11 mejora el soporte de trackpad al nivel de mouse y pointer, y añade una API de testing para entradas no táctiles
Compose añade una API experimental para state-based styling
Connected Displays se ofrece públicamente a través de Android Feature Drop
Las bibliotecas Compose, Navigation 3 y Compose Adaptive responden a múltiples pantallas como foldables, desktop, auto, TV y XR

Sesión 17 - Building the quantum-AI future with Hartmut Neven and James Manyika

El tema central es cómo la computación cuántica y la IA se aceleran mutuamente
Hartmut Neven inició el equipo de Quantum AI de Google en 2012
superposition y qubit son la base de la computación cuántica
La cantidad de bit strings posibles en un chip de 105 qubits es 2 elevado a 105
La comunidad ya ha identificado más de 70 algoritmos y problemas que una computadora cuántica puede resolver de forma útil
En el futuro, esa cifra podría multiplicarse por más de 10
quantum error correction es una tecnología clave para mantener el estado de superposición
Google logró en 2022 reducir errores en máquinas reales mediante quantum error correction
Quantum Echoes se vincula con la forma de aprender a partir de datos generados por NMR o MRI
Google plantea que la transición hacia post-quantum cryptography debe avanzar con mayor solidez de aquí a 2029

Sesión 18 - Scale AI with Google’s TPU software stack

Trata sobre una pila de software open source para entrenar, ajustar finamente e inferir modelos sobre TPU
El flujo de desarrollo de modelos se divide en pre-training, post-training y serving/inference
Se puede probar post-training e inference con las TPU gratuitas de Kaggle y Colab
La demo de vLLM on TPU ejecuta el modelo Gemma 4 31B en TPU y resume información nutricional a partir de imágenes de comida
Gemma 4 es un modelo multimodal adecuado para recibir imágenes, entender su contenido y resumirlo
Al incorporar MTP en vLLM TPU inference, se obtuvo una mejora de velocidad de alrededor de 3 veces en varias tareas
Tunix es un framework ligero para post-training
En lugar de un modelo grande, se ajusta finamente un modelo de 4B para realizar la misma tarea y ejecutarlo en un solo chip Trillium
MaxText, Tunix, vLLM, JAX, PyTorch y TPU se ubican como herramientas a lo largo del ciclo de vida del modelo

Sesión 19 - Supercharge your AI coding workflow with Chrome DevTools for agents

Chrome DevTools for agents es una herramienta que permite a los agentes de programación observar directamente el runtime del navegador a través de DevTools
Así como los desarrolladores humanos aprenden y depuran con DevTools, los agentes de programación también deben tener el mismo ciclo cerrado de retroalimentación
Los agentes pueden abrir una instancia real de Chrome, navegar por páginas, llenar formularios y recopilar console log y network request
Gracias al acceso a source maps, pueden saltar de un problema en runtime al archivo fuente relacionado
La herramienta se ofrece como NPM package e incluye MCP server y CLI
Seis skills disponibles:
- troubleshooting, Chrome DevTools y Chrome DevTools CLI skill ayudan con el uso general y los conceptos
- accessibility debugging, memory leak debugging y optimized LCP skill incorporan conocimiento especializado al agente
La implementación se basa en Puppeteer, y los agentes usan un wrapper de la herramienta en lugar de usar Puppeteer directamente
De forma predeterminada, usa un perfil de navegador anónimo independiente y no accede al Chrome password manager
CyberAgent auditó 236 stories de Storybook de 32 componentes en menos de una hora con DevTools for agents

Sesión 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis

Demis Hassabis definió el objetivo original de DeepMind como “solve intelligence”
El tema central es cómo la IA está transformando el descubrimiento científico, los productos y las herramientas de investigación
AlphaFold vuelve a citarse como un caso que resolvió un problema de 50 años sobre la estructura de las proteínas
Gemini for Science se conecta con la línea de modelos científicos presentada en la keynote
Demis Hassabis describe este momento como estar en las “foothills” de la singularidad, y sitúa la resolución de la inteligencia alrededor de 2030, con un margen de un año
Los modelos de la familia Genie se usan para que Waymo pruebe situaciones 1 in a billion que son difíciles de ver en el mundo real
Los avances de Isomorphic Labs en drug discovery se presentan como un ejemplo de cómo la IA acelera la ciencia
La app de Gemini tiene 900 millones de usuarios mensuales, y AI Mode in Search también se ha convertido en una superficie clave de producto
La IA se usa no solo como funcionalidad de producto, sino como herramienta para resolver problemas científicos y de investigación

Sesión 21 - A fireside chat on the evolution of the developer craft

En la era de la IA, el trabajo del desarrollador se desplaza de escribir código hacia diseño de sistemas, documentación y orquestación
Aunque siguen apareciendo nuevas herramientas y modelos, no es necesario seguir todas las tendencias de inmediato; hay que elegir de forma intencional qué herramientas aprender
Incorporar agentes al equipo se parece a sumar varios ingenieros junior, por lo que la documentación interna y el registro de decisiones de diseño se vuelven más importantes
Para crear un buen agentic workflow, hay que definir la responsabilidad de cada agente, cómo conversan varios agentes entre sí y en qué punto supervisa la persona
La UX de varias herramientas de programación se está pareciendo, así que los patrones aprendidos en una herramienta pueden trasladarse a otras
Al trabajar con agentes, hay que soltar parte del control del proceso y centrarse en alinear los resultados y la intención de diseño
La technical debt, cognitive debt e intent debt pueden mejorar más rápido o empeorar más rápido con la IA
Ejecutar 20 agentes al mismo tiempo puede superar la capacidad cognitiva humana, por lo que hay que gestionarlo de forma intencional
Los buenos hábitos de prompting cambian de fragmentos de búsqueda a formular objetivos completos con contexto
Más importante que “si escribes todo el código tú mismo” es “si cuentas con el contexto y el sistema de verificación para que el agente pueda trabajar”

Sesión 22 - Build core skills to thrive as an AI-era developer

Incluso en la era de la IA, las capacidades básicas de ingeniería de software se vuelven aún más importantes
La IA puede ser un force multiplier, pero se necesita experiencia profunda para evaluar, integrar y mantener sus resultados
Cuanto más autónomos sean los agentes, más se necesita un enfoque shift-left para aclarar la intención desde etapas más tempranas
El diseño de sistemas se amplía hasta incluir entorno, personas, agentes, herramientas y cultura
En lugar de usar agentes listos para usar, los equipos deben crear y mantener directamente el rol, perfil, receta, regla y habilidad de cada agente
Las specs, reglas de agentes y habilidades se convierten en la source of truth que transmite a los agentes el qué y el porqué del sistema
Para crear una evaluación realista, se necesitan en conjunto capacidades de IA, ingeniería de software, usuarios y negocio
Hay que crear un ciclo de retroalimentación que analice el agent trace para mejorar la usabilidad de las herramientas, las habilidades del agente y el diseño del sistema
Los ingenieros humanos pasan de ser el conductor de un agente individual a ser el orchestrator de varios equipos de agentes asíncronos
Para ver el sistema desde la perspectiva de actores maliciosos, se puede asignar explícitamente un agente de red team

Sesión 23 - Software engineering at the tipping point

Si la IA acelera la escritura de código, todo el ecosistema de desarrollo recibe presión a nivel de software ecology
En Google, todo el código, incluido Android y Chrome, está en un monorepo compartido y se confirma en el trunk
Desde hace mucho tiempo, Google usa herramientas internas con las que un solo desarrollador puede modificar millones de líneas de código
Es muy probable que el ecosistema de desarrollo actual no pueda soportar una velocidad 10 veces mayor
Si los agentes generan más compilaciones, pruebas, commits y uso de tokens, aumentan los costos de infraestructura y los cuellos de botella
Los agentes pueden crear código fácil de escribir, pero no necesariamente código fácil de mantener para las personas
Se necesitan habilidades agentic de component reuse y component isolation que impongan reutilización y aislamiento
El acceso a APIs y datos debe protegerse con solidez, como si en la práctica estuviera expuesto a los agentes
La frase “agents will find things you probably didn't want them to” deja en evidencia los riesgos del diseño de permisos
En el ecosistema de desarrollo de 2030, la forma actual de trabajar podría parecer tan anticuada como la era del CD-ROM de 2001

Sesión 24 - Vibe once, run anywhere with Google Antigravity and Flutter

Si se usan juntos Antigravity y Flutter, una idea creada una sola vez puede expandirse a múltiples plataformas
Desde el lanzamiento de Gemini 3, la capacidad del modelo ha aumentado mucho, y Antigravity la ha soportado desde el principio
Antigravity se centra en un ciclo de retroalimentación donde planificación, ejecución y verificación están estrechamente conectadas
Antigravity crea una lista de tareas y un plan de implementación, deja screenshots y video durante la ejecución, y al terminar redacta un informe con lo implementado y las razones
En la etapa de verificación, se encadenan la ejecución de la app, la captura de screenshots, el clic en botones de Chrome y la ejecución de pruebas
En Flutter, el tipado fuerte de Dart y el analysis server proporcionan al LLM señales objetivas de error, como firmas de funciones y estructuras de clases
Flutter es un cross-platform UI toolkit que ofrece los mismos píxeles y funciones en múltiples pantallas
El stateful hot reload de Flutter ofrece una experiencia de desarrollo que vuelve a compilar la app en ejecución en menos de 1 segundo
Cuanto más código generen los agentes, más deberán las personas definir los objetivos de diseño y la dirección del producto, y revisar los resultados de los agentes
Antigravity proporciona el ciclo de ejecución de agentes, y Flutter ofrece resultados consistentes en múltiples plataformas, creando el flujo “vibe once, run anywhere”

3 comentarios

jhk0530 2026-05-21

Al ver que primero me genera rechazo cuando cambia algo a lo que ya estaba acostumbrado, siento cada vez más que me estoy haciendo viejo T_T

GN⁺ 2026-05-21

Comentarios de Hacker News

En lo personal, el keynote fue de lo más aburrido
Lo pausé para ir al baño y hasta se me olvidó que lo estaba viendo; parece que Google está perdiendo de vista qué significan I/O y el keynote para los usuarios
Habría sido mejor hacer un evento aparte solo para Gemini, como el evento de Android de la semana pasada, y al enfocarse en meterle AI a todos los productos también se están desdibujando los límites entre líneas de producto
Google Home es un desastre y sigue fallando en funciones básicas, pero la presentación del VP de Google Home siempre termina siendo pura charla sobre Gemini. Incluso les tomó años reducir la frecuencia con la que los dispositivos se quedan offline
Las sesiones también se ven deslucidas, como una mezcla de “nuevas funciones de X” y “cosas varias de AI”
- Esto es resultado de un problema estructural de Google: lanzar sí se recompensa, pero dar mantenimiento no, y los equipos nuevos reciben muchos más recursos que los equipos ya probados
  En tres palabras: “lo nuevo es mejor”
  Por eso Google Home va empeorando. Nadie asciende por mantener en buen estado algo que ya funcionaba suficientemente bien; para ascender hay que lanzar alguna función nueva en esa plataforma y luego demostrar “impacto” con métricas escogidas convenientemente
  Por la misma razón el keynote fue pura AI. AI es ahora mismo el caos de moda al que le están aventando recursos, y si meten AI en todos los productos, muchísima gente obtiene la oportunidad de lanzar funciones nuevas y mostrar “impacto”
  I/O es un evento para desarrolladores, sí, pero pensar que Wall St. no está mirando sería ingenuo. Antes de que empezara I/O, la acción había caído 10 dólares ese mismo día, pero durante el keynote subió 5 dólares, y aunque no se sostuvo, está claro que el keynote sí afectó el precio. Sundar también lo sabe
- Dijeron que pasarán de invertir entre 10 y 30 mil millones de dólares a 160 mil millones de dólares, y que todo ese dinero irá a cómputo e investigación
  Solo experimentar directamente la cantidad de cómputo adicional que la sociedad está sumando a nivel global ya hace que esta sea una época impresionante
  La calidad de Gemini volvió a mejorar, y ahora también hay agentes de larga duración. Eso va a golpear a mucha gente que “hace cosas con una computadora”
  Cuando esto entre en producción real, tal vez prefieran despedir a 1 o 2 colegas y convertir esos salarios en tokens. Es cuestión de tiempo para que alguien piense lo mismo de mí
  Nada de esto me parece deslucido en lo más mínimo, así que no entiendo cómo pueden salir posturas tan extremadamente opuestas
Al ver esas presentaciones tan acartonadas, casi coreografiadas, y a la gente que parecía estar leyendo prompts fuera de cámara, las presentaciones de Steve Jobs se sienten todavía más impresionantes
No sé si realmente era así, pero al menos se veía así, y Steve era realmente bueno presentando productos. Como mínimo me gustaría que la gente intentara copiarlo
- Ayudaba que él realmente usaba esos productos y creía en ellos
- Sería más divertido si alguien intentara imitar a Steve Wozniak
- En realidad, mucha gente lo ha intentado. Sinofsky cuando presentó la Surface Laptop hace algunos años, y también muchísimos fundadores
  Steve era absolutamente un prodigio para keynotes y demos técnicas, y hay personas que simplemente nacen con ese talento
- Hubo de verdad un momento en esta presentación en el que seguían diciendo que era increíble que “Gemini me hizo una lista de pendientes”
- Esto es maximización de AI extendiéndose a todas partes. Si le pides “hazme una presentación de conferencia impactante”, te sale más o menos esto
  Es un deterioro masivo al estilo AI, y da tristeza verlo
Me intriga qué tienen preparado para los modelos locales de Gemma y Flutter
Estoy construyendo apps totalmente locales usando Gemma 4 2B descargado, o AICore integrado en Android, o Foundation Models de Apple
Últimamente los modelos locales han mejorado bastante, incluso con búsqueda web y tool calling, al punto de que para muchos casos de uso ya no se necesita un modelo en la nube
- Según entiendo, mañana hay un keynote de Gemma
- Como Gemma 4 salió hace poco, no espero nada en particular
En Firefox de escritorio el botón Join the livestream no funcionó, y en Chrome no hubo problema
- En Chrome tampoco me funcionó, así que tuve que buscar el stream en YouTube: https://www.youtube.com/watch?v=wYSncx9zLIU
- Tuve el mismo problema en Firefox
- Tuve que desactivar uBlock. Puede que esté instalado en Firefox y no en Chrome
Me parece interesante que 3.5 Flash salga antes que 3.5 Pro
Históricamente en Gemini, Flash parecía ser un modelo destilado a partir de Pro, así que el orden era al revés. ¿Será que lo entrenan un poco más hasta que supere a Pro en benchmarks?
- También es muy probable que 3.5 Flash cueste menos de ejecutar que Pro. Quizá esta empresa también esté corta de recursos de cómputo, como las demás
- Si las afirmaciones de la presentación son ciertas, entonces debería haber mejorado bastante frente al 3.5-flash-preview que probé hace unos meses
  En ese momento ni siquiera podía corregir un script de Python de 200 líneas sin cometer errores grandes, y rompía cosas como el orden de los argumentos en llamadas a funciones
- Que Flash supere a Pro, del cual supuestamente fue destilado, no suena tanto sorprendente como sospechoso. La destilación normalmente implica perder algo
  Si un modelo más pequeño gana en evaluaciones de agentes, lo más probable es que esas evaluaciones en realidad no estuvieran midiendo la calidad del agente desde el principio
  Para quien construye sobre estos modelos, eso es un problema todavía mayor que elegir el modelo
Extraño los viejos tiempos en que realmente poseíamos y controlábamos por completo nuestros dispositivos. Quiero eso de vuelta
- ¿Cuándo fue eso? ¿Cuando los teléfonos todavía tenían cable?
- No soy tan joven, pero no termino de entender por qué resulta tan atractiva esa era anterior a la caída en la que supuestamente controlábamos nuestros dispositivos
  En tecnología, claramente hoy estamos mucho mejor. Linux hoy es excelente, el self-hosting es barato y fácil de empezar
  No me queda claro exactamente en qué sentido ahora estamos peor en cuanto a controlar nuestros propios dispositivos
El ambiente se siente totalmente fuera de tono. Extraño aquellos I/O de antes, centrados en Android y llenos de optimismo
- Solo con ver el artículo de Wikipedia de I/O ya se nota lo triste que se ha vuelto: https://en.wikipedia.org/wiki/Google_I/O
  Pasó de ser “la respuesta de Google a WWDC y a los eventos de lanzamiento de Apple” a “AI en todas partes al mismo tiempo”
  Da mucha pena ver todas las cosas geniales que Google lanzó entre 2008 y 2020
  Claro, no es solo un problema de Google. Las grandes conferencias en general están cambiando así. Es puro AI. Tal vez CES no, pero aun así
- Siendo justos, no creo que esto sea culpa solo de Google. Por allá de 2009, lo móvil estaba en una especie de explosión cámbrica de posibilidades, y hoy la tecnología simplemente ya está lo suficientemente resuelta
- Antes era interesante, pero ahora es puro humo de AI, y Android en realidad casi no cambia
Desde que lanzaron Google Wave en 2009, Google I/O era mi evento tecnológico favorito, y ahí fue cuando me enganché por completo
- Google Wave se adelantó a su tiempo. Podría haber sido un competidor serio para Slack
- Me acuerdo de ese lanzamiento. También de Lars batallando tristemente en el escenario mientras tenían problemas de conexión
  Unos años después también estuvo lo del paracaidismo con Google Glass; eran tiempos divertidos
La demo fue básicamente “en vez de conocer a tus vecinos, deja que un agente de AI planee la fiesta de la cuadra”
- Si le preguntas al AI Mode de Gemini “¿cuál sería una buena demo de flujo de trabajo con agentes que el público general reciba bien en Google I/O?”, seguro te da un caso de uso mejor que lo que están mostrando ahora
- Al final esto siempre termina siendo reservar vuelos o restaurantes. Lo muestran cada año y nunca ha funcionado bien
¿Spark significa openclaw alojado en la nube?
- Más o menos sí

hmmhmmhm 2026-05-21

Flash es demasiado caro; de ahora en adelante voy a vivir para siempre en el hosting de gemma de OpenRouter