8 puntos por xguru 2026-05-21 | 3 comentarios | Compartir por WhatsApp
  • Los ejes principales son Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play y las capacidades de los desarrolladores en la era de la IA
  • Google puso al frente no solo el anuncio de modelos, sino también un flujo de desarrollo donde los agentes acceden a productos reales, el navegador, la nube, apps móviles, datos, documentos y entornos de prueba
  • Las herramientas de desarrollo ya no se limitan a escribir código, sino que se expanden a planificación, ejecución, verificación, depuración, despliegue, evaluación y coordinación de múltiples agentes
  • Android, Flutter, Chrome, Firebase y Google Play se expanden integrando Gemini y herramientas de agentes dentro del flujo de desarrollo existente
  • Más que escribir código, el costo de validación, la provisión de contexto, los permisos de acceso a herramientas, la observabilidad en runtime, la infraestructura de pruebas y la documentación y diseño de sistemas de la organización están surgiendo como cuellos de botella mayores

Sesión 1 - Google keynote

  • Cada mes, más de 8.5 millones de personas crean apps y experiencias con modelos de Google
  • Las API de modelos de Google procesan alrededor de 19 mil millones de tokens por minuto
  • Uso de AI Search:
    • AI Overviews es usado por más de 2.5 mil millones de personas al mes
    • AI Mode es usado por más de mil millones de personas al mes
  • Los usuarios activos mensuales de la app de Gemini crecieron de 400 millones en el I/O del año pasado a más de 900 millones
  • Con el modelo Nano Banana se han generado más de 50 mil millones de imágenes
  • Gemini 3.5 Flash está disponible en productos y API, y sus características clave son la ejecución rápida y la eficiencia en costos
  • Gemini Omni Flash es el primer modelo de la familia Omni, orientado a manejar de forma más amplia entradas y salidas multimodales
  • Antigravity 2.0 es una app de escritorio independiente disponible globalmente, que reúne en una sola pantalla conversaciones con agentes, proyectos y gestión de tareas
  • Gran demo de Antigravity:
    • Con 93 subagentes, más de 15,000 solicitudes al modelo y 2.6 mil millones de tokens, construyó el núcleo de un sistema operativo funcional desde un proyecto vacío
    • Se ejecutó con menos de 1,000 dólares en créditos de API aprovechando el rendimiento y la eficiencia en costos de Gemini 3.5 Flash

Sesión 2 - Developer keynote

  • Google presentó para desarrolladores un flujo que combina modelos, herramientas de agentes, plataformas para usuarios e infraestructura
  • Managed agents llega a la Gemini API, permitiendo usar en forma de API un agent harness como Antigravity
  • Google Antigravity 2.0 es una app de escritorio centrada en agentes, con una estructura donde múltiples agentes se encargan del trabajo de desarrollo
  • Con el Antigravity SDK se pueden personalizar y desplegar directamente flujos de agentes
  • En Google AI Studio, los nuevos usuarios pueden desplegar directamente en Cloud Run sin tarjeta de crédito
  • Con la integración con Google Workspace, AI Studio puede usar datos de Workspace dentro del flujo de creación de apps
  • En Google AI Studio ahora es posible convertir una idea directamente en una app de Android
  • Gemma 4:
    • Se ofrece bajo licencia Apache 2
    • Alcanzó 100 millones de descargas en el primer mes
    • Las descargas totales de Gemma superaron 500 millones
  • Chrome DevTools for Agents se puede usar en Antigravity y en más de 20 agentes de programación
  • Gemma 4 se ajustó finamente con LoRA para generar respuestas de comandos bash listas para usarse en un pipeline de CI y desplegarse en una laptop local

Sesión 3 - Agent-first workflows from prompt to production

  • Después de desplegar apps creadas en AI Studio con Cloud Run y Firebase, el flujo con agentes se conecta también con la depuración y el análisis en operación
  • A través de más de 50 servidores MCP administrados, los agentes acceden a herramientas y datos de Google Cloud
  • Developer Knowledge MCP incorpora a las herramientas de agentes información actualizada basada en la documentación de Google para reducir problemas por documentación desactualizada
  • Los snapshots de la documentación más reciente llegan a las herramientas de agentes aproximadamente cada 8 a 12 horas
  • Con Data Agent Kit y BigQuery MCP, se analizan datos de Firestore, BigQuery y logs, y se crean dashboards
  • Antigravity puede investigar errores de una app, encontrar archivos relacionados, corregirlos e incluso continuar hasta un commit en GitHub
  • Un remediation agent y un CI agent desplegados en Cloud Run se conectan con Eventarc, Pub/Sub y Gemini para investigar y corregir errores
  • Varios agentes se pasan tareas entre sí mediante A2A (agent-to-agent)
  • El desarrollo con agentes no termina en la creación de prototipos, sino que se extiende a despliegue, monitoreo, análisis de datos y recuperación automática

Sesión 4 - What’s new in Android

  • Android 17 agrega límites de memoria y herramientas relacionadas para evitar que el uso excesivo de memoria de una app arruine la experiencia del usuario
  • Android 17 toma condiciones como excessive memory, cold start y excessive CPU como objetivos de análisis automático
  • Las apps dirigidas a Android 17 necesitan el permiso ACCESS_LOCAL_NETWORK para encontrar y conectarse a dispositivos de red local
  • Google refuerza su dirección de construir la UI de Android con Jetpack Compose
  • Compose 1.10 y Compose 1.11 incluyen mejoras de rendimiento, hybrid UI y nuevas API
  • La integración de AppFunctions con Gemini está en vista previa privada, y las apps pueden convertirse en objetivos de orquestación de Gemini
  • La developer preview de ML Kit Prompt API permite probar algunas funciones nuevas
  • Android 17 ofrece Eclipsa Video, mejoras en la calidad de voz HE-AAC y mejoras de cámara y medios basadas en CameraX y Media3
  • Las apps para pantallas grandes avanzan hacia un enfoque menos atado a las limitaciones móviles tradicionales usando Navigation 3 y la biblioteca Compose Adaptive
  • Compose 1.6 para Wear OS admite Navigation 3 y mode manager para ayudar con la gestión de contenido en modo de ahorro de energía

Sesión 5 - What’s new in Chrome

  • Chrome se enfoca en lograr que los sitios web funcionen bien para usuarios que usan agentes y herramientas de tipo agente
  • Busca conectar las herramientas de desarrollo con Baseline y funciones web actualizadas, en lugar de depender solo del conocimiento base del modelo
  • Desde el año pasado, 55 funciones pasaron al estado Baseline Widely Available
  • Al momento del anuncio, 52 funciones estaban en estado Baseline Newly Available
  • Como Chrome se actualiza cada 4 semanas, si los agentes de programación no conocen las funciones web más recientes, es fácil que produzcan implementaciones obsoletas
  • La Prompt API de Chrome estará disponible en Chrome 148
  • Navigation API, View Transitions, HTML-in-Canvas y declarative partial updates se incorporan al flujo de desarrollo
  • Los desarrolladores de extensiones de Chrome ahora pueden inspeccionar y depurar automáticamente la instalación, service worker, side panel y popup
  • Chrome se expande para ofrecer a los agentes habilidades de alto nivel sobre rendimiento web, identity, security y más de 100 guías de casos de uso comunes
  • Para reducir la repetición de patrones de compatibilidad obsoletos, es necesario proporcionar a los agentes información sobre funciones web recientes y soporte del navegador

Sesión 6 - What’s new in Google AI

  • La familia de modelos Gemini es una familia de modelos multimodales capaz de manejar entradas de texto, imagen, audio, video y código, además de múltiples formatos de salida
  • Roles de Gemini 3.5 Pro y Flash:
    • Gemini 3.5 Pro se enfoca en resolver problemas complejos
    • Gemini 3.5 Flash se encarga del equilibrio entre rendimiento, velocidad y costo
  • La función Build de AI Studio usa 3.5 Flash como modelo predeterminado
  • Nano Banana 2 se puede probar directamente en AI Studio
  • Gemini Omni Flash es un modelo capaz de generar salidas, incluido video, a partir de entradas
  • Gemini Live y Live API admiten interacciones basadas en voz
  • Interactions API es una función para interactuar con agentes dentro de AI Studio
  • Accesibilidad de Gemma 4:
    • Se puede probar en el playground de AI Studio
    • También permite algunas llamadas gratuitas en la Gemini API
    • Tiene una ventana de contexto de 256,000 tokens y se puede encontrar en Hugging Face
  • También se presentaron Gemini Robotics 1.6, Genie 3, Antigravity 2.0 y una estrategia para reducir costos combinando modelos abiertos y modelos propietarios

Sesión 7 - Build next-gen AI experiences with Google AI Studio and Google Antigravity

  • Google AI Studio se expandió más allá del model playground para convertirse en un espacio donde crear ideas de apps y desplegarlas
  • Modelos, agentes, generación de apps, integración con Workspace y despliegue en Cloud Run forman parte de un mismo flujo
  • La sección de apps de AI Studio estará disponible pronto y abordará de forma más directa la creación y el despliegue de apps
  • Se agregó una función para exportar de una vez a Antigravity el código creado en AI Studio
  • Antigravity 2.0 no solo escribe código, también asume el papel de mission control para coordinar múltiples tareas como agente
  • Antigravity 2.0 tiene como flujo principal la task list, el implementation plan y la revisión de archivos modificados
  • Las revisiones de código y de cambios se pueden gestionar directamente dentro de Antigravity 2.0
  • La estructura está pensada para delegar al agente tareas pesadas como pruebas en navegador, planificación, desarrollo de funciones en múltiples archivos y verificación end-to-end
  • Con Google AI Studio se puede crear una nueva app de negocio en unos 20 minutos y luego desarrollarla más con Antigravity
  • Google AI Studio es el punto de arranque rápido de “prompt to app”, y Antigravity es la herramienta para llevar esa app a trabajo de desarrollo real

Sesión 8 - Unlock modern web capabilities in your AI coding workflows

  • Si un agente de codificación no conoce las capacidades web modernas, es fácil que genere código con criterios de compatibilidad de navegadores desactualizados
  • Chrome lanzó 50 funciones nuevas en el último año, pero por el knowledge cutoff de los modelos muchas de ellas no llegan a los modelos
  • En el ejemplo de Interest Invokers API aparece el problema de que el agente usa el nombre de atributo antiguo interesttarget
  • Modern Web Guidance es un paquete de conocimiento que ayuda a los agentes a encontrar funciones web modernas y las implementaciones recomendadas
  • Antes de responder, el agente realiza una búsqueda semántica dentro de un paquete local
  • Escala y estructura de la guía:
    • Actualmente hay más de 100 guías
    • La estructura permite no exponer todas las skill por función como herramientas de nivel superior, sino encontrarlas y usarlas cuando se necesitan
  • Las guías ofrecen tanto la implementación moderna ideal como recomendaciones de fallback
  • Si no hay requisitos de compatibilidad entre navegadores, el agente toma Baseline Widely Available como supuesto predeterminado
  • Si en AGENTS.md se especifican condiciones como “solo compatible con Chrome 144 o superior”, el agente puede evitar fallback innecesarios
  • El equipo de Chrome ejecuta evaluaciones todos los días con modelos como Gemini 3.1, Claude Opus 4.7 y GPT 5.5

Sesión 9 - What’s new in Firebase

  • Firebase está migrando hacia una agent-native platform donde tanto personas como agentes pueden crear y escalar apps
  • Firebase Data Connect evolucionó a Firebase SQL Connect, que respalda el desarrollo de apps basado en SQL
  • Con los custom resolver de Firebase SQL Connect se pueden conectar servicios de Google Cloud como Cloud Functions y BigQuery
  • Firestore admite geo search, native full text search y semantic match
  • Firebase AI Logic es compatible con los modelos más recientes y permite crear funciones de IA con reconocimiento de ubicación mediante Maps grounding
  • Las funciones de control de generación de imágenes de Nano Banana también se pueden usar en Firebase AI Logic
  • Firebase AI Logic admite inferencia local e híbrida en iOS, Chrome y Android, y hace fallback a un cloud-hosted model cuando no hay modelo local
  • Dart support for Cloud Functions in Firebase está disponible como experimental preview
  • AI Studio está conectado con Google Workspace, por lo que los datos de Sheets, Docs, Gmail y Calendar pueden usarse en apps
  • Firebase agent skills se puede usar en Android, iOS, web y Flutter, y también se amplió la compatibilidad con Crashlytics

Sesión 10 - What’s new in Google Play

  • Play Billing admite más de 300 métodos de pago locales en más de 65 mercados
  • Google Play tiene más de 890 millones de usuarios listos para comprar
  • Se amplían las opciones para ofrecer Google Play Billing junto con pagos alternativos, y también se anunciaron comisiones de servicio más bajas
  • El descubrimiento de apps se expande a la app de Gemini, Android y la web, para que los usuarios puedan encontrar apps y juegos dentro de Gemini
  • En lugar de una lista estática de enlaces, Gemini recomienda apps usando las funciones reales de la app y la información del store listing
  • En algunos temas, los usuarios de Gemini y Play pueden explorar más de 450,000 contenidos de películas y TV
  • En Play Console, si se suben archivos estructurados como Eclipsa Video o Google Sheets, Gemini completa previamente el listing
  • Gemini ayudará con tareas de Play Console como bulk price changes, import skills y metadata configuration
  • Con la in-app subscription management API, los usuarios podrán cambiar fácilmente de plan de suscripción dentro de la app
  • El año pasado, Google Play Billing bloqueó 3,400 millones de dólares en intentos de fraude y 130 millones de dólares en abusive refunds

Sesión 11 - Defining the agentic AI era

  • Gemini, Search, la app de Gemini y Google DeepMind abordan la IA agéntica en una misma dirección
  • Gemini 3.5 Flash también puede usarse dentro de Search
  • Search debe encontrar el equilibrio entre respuestas rápidas y tareas agénticas más largas
  • Gemini Spark asume el rol de un agente always-on que se encarga en segundo plano de las tareas que el usuario le deja
  • El modelo debe ir más allá de simples respuestas de chat y operar sobre todo el conjunto de productos de Google y el ecosistema externo
  • Herramienta interna traducida de Python a Go:
    • Traducir a otro lenguaje un programa existente con pruebas es un problema más claro para el modelo
    • Algunas herramientas internas se volvieron 10-20 veces más rápidas de la noche a la mañana
  • La infraestructura interna de software de Google también puede cambiar más rápido para adaptarse al nuevo mundo agéntico
  • El hardware, la escala de los modelos, la aplicación en productos y el ciclo de retroalimentación deben encajar juntos para que Gemini pueda integrarse en todos los productos de Google
  • El foco de las preguntas se desplaza de “qué puede hacer el modelo” a “cómo ubicar el modelo dentro de productos y flujos de trabajo”

Sesión 12 - What’s new in Android development tools

  • Las herramientas de desarrollo de Android están diseñadas pensando no solo en desarrolladores humanos, sino también en agentes de IA desplegados dentro de la base de código
  • Android Studio Otter es compatible con cuentas de Gemini Enterprise y Google One
  • Android Studio puede importar y usar modelos locales y remotos
  • Android Bench sirve como criterio para decidir qué modelo usar en tareas de desarrollo de Android
  • Se pueden pedir transformaciones de UI directamente desde Compose Preview para que el agente trabaje con mejor contexto
  • Se puede usar un agent-based new project wizard para crear una app Android adaptativa solo con prompts
  • Android Studio incluye alrededor de 10 skills para ayudar con tareas como la integración de APIs adaptativas y la conversión de XML a Compose
  • El nuevo Android CLI admite flujos de trabajo con LLM y, al crear proyectos nuevos, reduce el uso de tokens en más del 70% frente a otras herramientas LLM para Gradle
  • Al agrupar Antigravity CLI, Android CLI y Android skill, también se puede empezar a desarrollar apps Android desde Antigravity
  • En Android Studio Quail y en dispositivos con Android 17, la conexión con el dispositivo se mantiene incluso si cambias de red o reinicias la laptop

Sesión 13 - What’s new in Flutter

  • Flutter 3.44 y Dart 3.12 se lanzan juntos
  • Este año participaron más de 1,700 contributors en el proyecto Flutter
  • Cada mes, más de 1.5 millones de desarrolladores construyen con Flutter
  • En Flutter 3.44 se puede probar un nuevo modo de renderizado en dispositivos Android compatibles con Vulkan y API 34 o superior
  • Flutter se usa en el sistema de infoentretenimiento del Toyota RAV4 2026
  • En Cloud Functions for Firebase basadas en Dart, hay casos donde el cold start baja hasta 10 ms gracias a la compilación AOT
  • Firebase AI Logic añade plantillas de prompts en el servidor, para no tener que incluir los prompts directamente en la app
  • Firebase Agent Skills for Flutter proporciona a los agentes guías para crear apps full-stack con Flutter y Firebase
  • El soporte de LiteRT-LM llegará pronto al paquete flutter_gemma
  • En Flutter desktop, Canonical participa como lead maintainer y strategic steward

Sesión 14 - What’s new in the Gemma open model family

  • Gemma 4 se consolida como el modelo abierto más potente de la familia Gemma
  • Está disponible en varios tamaños, de 2B a 31B, para usarse en móviles, laptops y la nube
  • Gemma comenzó en 2024 como una familia de modelos que iba de 1B a 27B
  • Gemma 4 es un modelo de pesos abiertos y compatible con el ecosistema open source
  • Con MTP y speculative decoding, la velocidad de decodificación puede aumentar hasta 3 veces
  • El ecosistema Android ya cuenta con una implementación day-zero de Gemma 4
  • A través de la API de Android, se pueden ejecutar directamente modelos pequeños de Gemma en el teléfono o desarrollar apps Android con un modelo Gemma local en entornos donde el acceso a la API de Gemini es difícil
  • Usan el ADK (agent development kit) sobre Cloud Run y Gemma 31B para crear agentes que entienden bases de datos y encuentran respuestas
  • Gemma 4 puede ejecutarse en el navegador o en entornos locales mediante las interfaces compatibles con OpenAI de Transformers.js, Ollama y LM Studio
  • La nube empresarial, las máquinas locales, el navegador y los móviles pasan a ser entornos de ejecución para Gemma

Sesión 15 - What’s new in Web UI

  • La actualización de Web UI de 2026 presenta las funciones principales junto con su estado en Baseline
  • Todas las funciones llevan indicadores de compatibilidad como Baseline Widely Available, Newly Available o Limited Available
  • Con la contrast-color API es más fácil elegir en CSS colores con el contraste adecuado
  • La función meta name="text-scale" de Chrome 146 responde a la configuración de tamaño de texto del sistema
  • Más del 30% de los usuarios de Android y iOS cambian el tamaño de texto predeterminado
  • Desde Chrome 134, el elemento dialog incorpora funciones del popover como declarative light dismiss
  • Las two-phase View Transitions pueden probarse en Chrome Canary
  • Las scroll-driven animations llegaron a Chrome en 2023, y con Interop 2026 mejoran su interoperabilidad
  • La HTML-in-Canvas API permite insertar contenido DOM real dentro de Canvas
  • En Chrome 149 se añaden nuevos usos para gap decorations y shape outside

Sesión 16 - Adaptive development for the expanding Android ecosystem

  • Android ya no es un ecosistema exclusivo de teléfonos, y más de 580 millones de dispositivos activos de pantalla grande se benefician de la inversión en apps adaptativas
  • Los usuarios de foldables se clasifican como un segmento de mayor valor en las apps adaptativas
  • En Android 17, se avanza hacia eliminar el opt-out de orientation y resizability para los objetivos con target SDK 37
  • El Desktop emulator de Android Studio Quail Canary permite probar apps de Android en formato de escritorio
  • Con la Continue On API de Android 17, los usuarios pueden continuar en un segundo dispositivo lo que estaban haciendo en otro
  • Google está reforzando la tendencia de crear apps de Android con un enfoque Compose-first
  • Compose 1.11 mejora el soporte de trackpad al nivel de mouse y pointer, y añade una API de testing para entradas no táctiles
  • Compose añade una API experimental para state-based styling
  • Connected Displays se ofrece públicamente a través de Android Feature Drop
  • Las bibliotecas Compose, Navigation 3 y Compose Adaptive responden a múltiples pantallas como foldables, desktop, auto, TV y XR

Sesión 17 - Building the quantum-AI future with Hartmut Neven and James Manyika

  • El tema central es cómo la computación cuántica y la IA se aceleran mutuamente
  • Hartmut Neven inició el equipo de Quantum AI de Google en 2012
  • superposition y qubit son la base de la computación cuántica
  • La cantidad de bit strings posibles en un chip de 105 qubits es 2 elevado a 105
  • La comunidad ya ha identificado más de 70 algoritmos y problemas que una computadora cuántica puede resolver de forma útil
  • En el futuro, esa cifra podría multiplicarse por más de 10
  • quantum error correction es una tecnología clave para mantener el estado de superposición
  • Google logró en 2022 reducir errores en máquinas reales mediante quantum error correction
  • Quantum Echoes se vincula con la forma de aprender a partir de datos generados por NMR o MRI
  • Google plantea que la transición hacia post-quantum cryptography debe avanzar con mayor solidez de aquí a 2029

Sesión 18 - Scale AI with Google’s TPU software stack

  • Trata sobre una pila de software open source para entrenar, ajustar finamente e inferir modelos sobre TPU
  • El flujo de desarrollo de modelos se divide en pre-training, post-training y serving/inference
  • Se puede probar post-training e inference con las TPU gratuitas de Kaggle y Colab
  • La demo de vLLM on TPU ejecuta el modelo Gemma 4 31B en TPU y resume información nutricional a partir de imágenes de comida
  • Gemma 4 es un modelo multimodal adecuado para recibir imágenes, entender su contenido y resumirlo
  • Al incorporar MTP en vLLM TPU inference, se obtuvo una mejora de velocidad de alrededor de 3 veces en varias tareas
  • Tunix es un framework ligero para post-training
  • En lugar de un modelo grande, se ajusta finamente un modelo de 4B para realizar la misma tarea y ejecutarlo en un solo chip Trillium
  • MaxText, Tunix, vLLM, JAX, PyTorch y TPU se ubican como herramientas a lo largo del ciclo de vida del modelo

Sesión 19 - Supercharge your AI coding workflow with Chrome DevTools for agents

  • Chrome DevTools for agents es una herramienta que permite a los agentes de programación observar directamente el runtime del navegador a través de DevTools
  • Así como los desarrolladores humanos aprenden y depuran con DevTools, los agentes de programación también deben tener el mismo ciclo cerrado de retroalimentación
  • Los agentes pueden abrir una instancia real de Chrome, navegar por páginas, llenar formularios y recopilar console log y network request
  • Gracias al acceso a source maps, pueden saltar de un problema en runtime al archivo fuente relacionado
  • La herramienta se ofrece como NPM package e incluye MCP server y CLI
  • Seis skills disponibles:
    • troubleshooting, Chrome DevTools y Chrome DevTools CLI skill ayudan con el uso general y los conceptos
    • accessibility debugging, memory leak debugging y optimized LCP skill incorporan conocimiento especializado al agente
  • La implementación se basa en Puppeteer, y los agentes usan un wrapper de la herramienta en lugar de usar Puppeteer directamente
  • De forma predeterminada, usa un perfil de navegador anónimo independiente y no accede al Chrome password manager
  • CyberAgent auditó 236 stories de Storybook de 32 componentes en menos de una hora con DevTools for agents

Sesión 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis

  • Demis Hassabis definió el objetivo original de DeepMind como “solve intelligence”
  • El tema central es cómo la IA está transformando el descubrimiento científico, los productos y las herramientas de investigación
  • AlphaFold vuelve a citarse como un caso que resolvió un problema de 50 años sobre la estructura de las proteínas
  • Gemini for Science se conecta con la línea de modelos científicos presentada en la keynote
  • Demis Hassabis describe este momento como estar en las “foothills” de la singularidad, y sitúa la resolución de la inteligencia alrededor de 2030, con un margen de un año
  • Los modelos de la familia Genie se usan para que Waymo pruebe situaciones 1 in a billion que son difíciles de ver en el mundo real
  • Los avances de Isomorphic Labs en drug discovery se presentan como un ejemplo de cómo la IA acelera la ciencia
  • La app de Gemini tiene 900 millones de usuarios mensuales, y AI Mode in Search también se ha convertido en una superficie clave de producto
  • La IA se usa no solo como funcionalidad de producto, sino como herramienta para resolver problemas científicos y de investigación

Sesión 21 - A fireside chat on the evolution of the developer craft

  • En la era de la IA, el trabajo del desarrollador se desplaza de escribir código hacia diseño de sistemas, documentación y orquestación
  • Aunque siguen apareciendo nuevas herramientas y modelos, no es necesario seguir todas las tendencias de inmediato; hay que elegir de forma intencional qué herramientas aprender
  • Incorporar agentes al equipo se parece a sumar varios ingenieros junior, por lo que la documentación interna y el registro de decisiones de diseño se vuelven más importantes
  • Para crear un buen agentic workflow, hay que definir la responsabilidad de cada agente, cómo conversan varios agentes entre sí y en qué punto supervisa la persona
  • La UX de varias herramientas de programación se está pareciendo, así que los patrones aprendidos en una herramienta pueden trasladarse a otras
  • Al trabajar con agentes, hay que soltar parte del control del proceso y centrarse en alinear los resultados y la intención de diseño
  • La technical debt, cognitive debt e intent debt pueden mejorar más rápido o empeorar más rápido con la IA
  • Ejecutar 20 agentes al mismo tiempo puede superar la capacidad cognitiva humana, por lo que hay que gestionarlo de forma intencional
  • Los buenos hábitos de prompting cambian de fragmentos de búsqueda a formular objetivos completos con contexto
  • Más importante que “si escribes todo el código tú mismo” es “si cuentas con el contexto y el sistema de verificación para que el agente pueda trabajar”

Sesión 22 - Build core skills to thrive as an AI-era developer

  • Incluso en la era de la IA, las capacidades básicas de ingeniería de software se vuelven aún más importantes
  • La IA puede ser un force multiplier, pero se necesita experiencia profunda para evaluar, integrar y mantener sus resultados
  • Cuanto más autónomos sean los agentes, más se necesita un enfoque shift-left para aclarar la intención desde etapas más tempranas
  • El diseño de sistemas se amplía hasta incluir entorno, personas, agentes, herramientas y cultura
  • En lugar de usar agentes listos para usar, los equipos deben crear y mantener directamente el rol, perfil, receta, regla y habilidad de cada agente
  • Las specs, reglas de agentes y habilidades se convierten en la source of truth que transmite a los agentes el qué y el porqué del sistema
  • Para crear una evaluación realista, se necesitan en conjunto capacidades de IA, ingeniería de software, usuarios y negocio
  • Hay que crear un ciclo de retroalimentación que analice el agent trace para mejorar la usabilidad de las herramientas, las habilidades del agente y el diseño del sistema
  • Los ingenieros humanos pasan de ser el conductor de un agente individual a ser el orchestrator de varios equipos de agentes asíncronos
  • Para ver el sistema desde la perspectiva de actores maliciosos, se puede asignar explícitamente un agente de red team

Sesión 23 - Software engineering at the tipping point

  • Si la IA acelera la escritura de código, todo el ecosistema de desarrollo recibe presión a nivel de software ecology
  • En Google, todo el código, incluido Android y Chrome, está en un monorepo compartido y se confirma en el trunk
  • Desde hace mucho tiempo, Google usa herramientas internas con las que un solo desarrollador puede modificar millones de líneas de código
  • Es muy probable que el ecosistema de desarrollo actual no pueda soportar una velocidad 10 veces mayor
  • Si los agentes generan más compilaciones, pruebas, commits y uso de tokens, aumentan los costos de infraestructura y los cuellos de botella
  • Los agentes pueden crear código fácil de escribir, pero no necesariamente código fácil de mantener para las personas
  • Se necesitan habilidades agentic de component reuse y component isolation que impongan reutilización y aislamiento
  • El acceso a APIs y datos debe protegerse con solidez, como si en la práctica estuviera expuesto a los agentes
  • La frase “agents will find things you probably didn't want them to” deja en evidencia los riesgos del diseño de permisos
  • En el ecosistema de desarrollo de 2030, la forma actual de trabajar podría parecer tan anticuada como la era del CD-ROM de 2001

Sesión 24 - Vibe once, run anywhere with Google Antigravity and Flutter

  • Si se usan juntos Antigravity y Flutter, una idea creada una sola vez puede expandirse a múltiples plataformas
  • Desde el lanzamiento de Gemini 3, la capacidad del modelo ha aumentado mucho, y Antigravity la ha soportado desde el principio
  • Antigravity se centra en un ciclo de retroalimentación donde planificación, ejecución y verificación están estrechamente conectadas
  • Antigravity crea una lista de tareas y un plan de implementación, deja screenshots y video durante la ejecución, y al terminar redacta un informe con lo implementado y las razones
  • En la etapa de verificación, se encadenan la ejecución de la app, la captura de screenshots, el clic en botones de Chrome y la ejecución de pruebas
  • En Flutter, el tipado fuerte de Dart y el analysis server proporcionan al LLM señales objetivas de error, como firmas de funciones y estructuras de clases
  • Flutter es un cross-platform UI toolkit que ofrece los mismos píxeles y funciones en múltiples pantallas
  • El stateful hot reload de Flutter ofrece una experiencia de desarrollo que vuelve a compilar la app en ejecución en menos de 1 segundo
  • Cuanto más código generen los agentes, más deberán las personas definir los objetivos de diseño y la dirección del producto, y revisar los resultados de los agentes
  • Antigravity proporciona el ciclo de ejecución de agentes, y Flutter ofrece resultados consistentes en múltiples plataformas, creando el flujo “vibe once, run anywhere”

3 comentarios

 
jhk0530 2026-05-21

Al ver que primero me genera rechazo cuando cambia algo a lo que ya estaba acostumbrado, siento cada vez más que me estoy haciendo viejo T_T

 
GN⁺ 2026-05-21
Comentarios de Hacker News
  • En lo personal, el keynote fue de lo más aburrido
    Lo pausé para ir al baño y hasta se me olvidó que lo estaba viendo; parece que Google está perdiendo de vista qué significan I/O y el keynote para los usuarios
    Habría sido mejor hacer un evento aparte solo para Gemini, como el evento de Android de la semana pasada, y al enfocarse en meterle AI a todos los productos también se están desdibujando los límites entre líneas de producto
    Google Home es un desastre y sigue fallando en funciones básicas, pero la presentación del VP de Google Home siempre termina siendo pura charla sobre Gemini. Incluso les tomó años reducir la frecuencia con la que los dispositivos se quedan offline
    Las sesiones también se ven deslucidas, como una mezcla de “nuevas funciones de X” y “cosas varias de AI”

    • Esto es resultado de un problema estructural de Google: lanzar sí se recompensa, pero dar mantenimiento no, y los equipos nuevos reciben muchos más recursos que los equipos ya probados
      En tres palabras: “lo nuevo es mejor”
      Por eso Google Home va empeorando. Nadie asciende por mantener en buen estado algo que ya funcionaba suficientemente bien; para ascender hay que lanzar alguna función nueva en esa plataforma y luego demostrar “impacto” con métricas escogidas convenientemente
      Por la misma razón el keynote fue pura AI. AI es ahora mismo el caos de moda al que le están aventando recursos, y si meten AI en todos los productos, muchísima gente obtiene la oportunidad de lanzar funciones nuevas y mostrar “impacto”
      I/O es un evento para desarrolladores, sí, pero pensar que Wall St. no está mirando sería ingenuo. Antes de que empezara I/O, la acción había caído 10 dólares ese mismo día, pero durante el keynote subió 5 dólares, y aunque no se sostuvo, está claro que el keynote sí afectó el precio. Sundar también lo sabe
    • Dijeron que pasarán de invertir entre 10 y 30 mil millones de dólares a 160 mil millones de dólares, y que todo ese dinero irá a cómputo e investigación
      Solo experimentar directamente la cantidad de cómputo adicional que la sociedad está sumando a nivel global ya hace que esta sea una época impresionante
      La calidad de Gemini volvió a mejorar, y ahora también hay agentes de larga duración. Eso va a golpear a mucha gente que “hace cosas con una computadora”
      Cuando esto entre en producción real, tal vez prefieran despedir a 1 o 2 colegas y convertir esos salarios en tokens. Es cuestión de tiempo para que alguien piense lo mismo de mí
      Nada de esto me parece deslucido en lo más mínimo, así que no entiendo cómo pueden salir posturas tan extremadamente opuestas
  • Al ver esas presentaciones tan acartonadas, casi coreografiadas, y a la gente que parecía estar leyendo prompts fuera de cámara, las presentaciones de Steve Jobs se sienten todavía más impresionantes
    No sé si realmente era así, pero al menos se veía así, y Steve era realmente bueno presentando productos. Como mínimo me gustaría que la gente intentara copiarlo

    • Ayudaba que él realmente usaba esos productos y creía en ellos
    • Sería más divertido si alguien intentara imitar a Steve Wozniak
    • En realidad, mucha gente lo ha intentado. Sinofsky cuando presentó la Surface Laptop hace algunos años, y también muchísimos fundadores
      Steve era absolutamente un prodigio para keynotes y demos técnicas, y hay personas que simplemente nacen con ese talento
    • Hubo de verdad un momento en esta presentación en el que seguían diciendo que era increíble que “Gemini me hizo una lista de pendientes”
    • Esto es maximización de AI extendiéndose a todas partes. Si le pides “hazme una presentación de conferencia impactante”, te sale más o menos esto
      Es un deterioro masivo al estilo AI, y da tristeza verlo
  • Me intriga qué tienen preparado para los modelos locales de Gemma y Flutter
    Estoy construyendo apps totalmente locales usando Gemma 4 2B descargado, o AICore integrado en Android, o Foundation Models de Apple
    Últimamente los modelos locales han mejorado bastante, incluso con búsqueda web y tool calling, al punto de que para muchos casos de uso ya no se necesita un modelo en la nube

    • Según entiendo, mañana hay un keynote de Gemma
    • Como Gemma 4 salió hace poco, no espero nada en particular
  • En Firefox de escritorio el botón Join the livestream no funcionó, y en Chrome no hubo problema

    • En Chrome tampoco me funcionó, así que tuve que buscar el stream en YouTube: https://www.youtube.com/watch?v=wYSncx9zLIU
    • Tuve el mismo problema en Firefox
    • Tuve que desactivar uBlock. Puede que esté instalado en Firefox y no en Chrome
  • Me parece interesante que 3.5 Flash salga antes que 3.5 Pro
    Históricamente en Gemini, Flash parecía ser un modelo destilado a partir de Pro, así que el orden era al revés. ¿Será que lo entrenan un poco más hasta que supere a Pro en benchmarks?

    • También es muy probable que 3.5 Flash cueste menos de ejecutar que Pro. Quizá esta empresa también esté corta de recursos de cómputo, como las demás
    • Si las afirmaciones de la presentación son ciertas, entonces debería haber mejorado bastante frente al 3.5-flash-preview que probé hace unos meses
      En ese momento ni siquiera podía corregir un script de Python de 200 líneas sin cometer errores grandes, y rompía cosas como el orden de los argumentos en llamadas a funciones
    • Que Flash supere a Pro, del cual supuestamente fue destilado, no suena tanto sorprendente como sospechoso. La destilación normalmente implica perder algo
      Si un modelo más pequeño gana en evaluaciones de agentes, lo más probable es que esas evaluaciones en realidad no estuvieran midiendo la calidad del agente desde el principio
      Para quien construye sobre estos modelos, eso es un problema todavía mayor que elegir el modelo
  • Extraño los viejos tiempos en que realmente poseíamos y controlábamos por completo nuestros dispositivos. Quiero eso de vuelta

    • ¿Cuándo fue eso? ¿Cuando los teléfonos todavía tenían cable?
    • No soy tan joven, pero no termino de entender por qué resulta tan atractiva esa era anterior a la caída en la que supuestamente controlábamos nuestros dispositivos
      En tecnología, claramente hoy estamos mucho mejor. Linux hoy es excelente, el self-hosting es barato y fácil de empezar
      No me queda claro exactamente en qué sentido ahora estamos peor en cuanto a controlar nuestros propios dispositivos
  • El ambiente se siente totalmente fuera de tono. Extraño aquellos I/O de antes, centrados en Android y llenos de optimismo

    • Solo con ver el artículo de Wikipedia de I/O ya se nota lo triste que se ha vuelto: https://en.wikipedia.org/wiki/Google_I/O
      Pasó de ser “la respuesta de Google a WWDC y a los eventos de lanzamiento de Apple” a “AI en todas partes al mismo tiempo”
      Da mucha pena ver todas las cosas geniales que Google lanzó entre 2008 y 2020
      Claro, no es solo un problema de Google. Las grandes conferencias en general están cambiando así. Es puro AI. Tal vez CES no, pero aun así
    • Siendo justos, no creo que esto sea culpa solo de Google. Por allá de 2009, lo móvil estaba en una especie de explosión cámbrica de posibilidades, y hoy la tecnología simplemente ya está lo suficientemente resuelta
    • Antes era interesante, pero ahora es puro humo de AI, y Android en realidad casi no cambia
  • Desde que lanzaron Google Wave en 2009, Google I/O era mi evento tecnológico favorito, y ahí fue cuando me enganché por completo

    • Google Wave se adelantó a su tiempo. Podría haber sido un competidor serio para Slack
    • Me acuerdo de ese lanzamiento. También de Lars batallando tristemente en el escenario mientras tenían problemas de conexión
      Unos años después también estuvo lo del paracaidismo con Google Glass; eran tiempos divertidos
  • La demo fue básicamente “en vez de conocer a tus vecinos, deja que un agente de AI planee la fiesta de la cuadra”

    • Si le preguntas al AI Mode de Gemini “¿cuál sería una buena demo de flujo de trabajo con agentes que el público general reciba bien en Google I/O?”, seguro te da un caso de uso mejor que lo que están mostrando ahora
    • Al final esto siempre termina siendo reservar vuelos o restaurantes. Lo muestran cada año y nunca ha funcionado bien
  • ¿Spark significa openclaw alojado en la nube?

    • Más o menos sí
 
hmmhmmhm 2026-05-21

Flash es demasiado caro; de ahora en adelante voy a vivir para siempre en el hosting de gemma de OpenRouter