La revolución de IA de Google: dos años de lucha para alcanzar a OpenAI

(wired.com)

35 puntos por GN⁺ 2025-03-28 | 4 comentarios | Compartir por WhatsApp

El inicio de la crisis de Google tras quedar rezagado en la revolución de los chatbots

En diciembre de 2022, Sissie Hsiao recibió la misión de desarrollar en 100 días el producto de Google para competir con ChatGPT
Hsiao, una veterana con más de 16 años en la empresa que había liderado a miles de personas, nunca antes había enfrentado una crisis tan grave
Después de que OpenAI lanzara ChatGPT, la cantidad de usuarios creció rápidamente hasta superar el millón, a pesar de los errores de hechos y de matemáticas
Algunos empezaron a ver a ChatGPT como un sustituto de Google Search, lo que representaba una amenaza para la mayor fuente de ingresos de Google
Google ya tenía su propio modelo de lenguaje, LaMDA, pero el acceso público era limitado y hasta sus demostraciones se reducían a “historias de perritos”
Wall Street (los mercados financieros) estaba inquieto, y aunque en el pasado el CEO Sundar Pichai había declarado la llegada de una “era AI-first” y dicho que los asistentes inteligentes reemplazarían a los dispositivos, la realidad no había estado a la altura de esas expectativas
El arquitectura Transformer también había sido creada por ocho investigadores de Google, pero ellos renunciaron o se fueron sin resultados concretos
Google Assistant, que Hsiao supervisaba, apenas se usaba para poner temporizadores o reproducir música
Todo lo que tenían era un chatbot incompleto para la Generación Z que ofrecía consejos de cocina y trivias de historia
Para finales de 2022, las acciones de Alphabet habían caído 39% frente al año anterior, y la posición de Google como líder en IA estaba tambaleándose

La respuesta de Google a la crisis de IA y el cambio de estrategia

A inicios de 2023, la junta directiva de Google exigió reportes en tiempo real sobre IA
- Sergey Brin, cofundador y accionista clave, también participó personalmente en las revisiones estratégicas
- A los empleados se les transmitió el mensaje de que “debían moverse como una startup”
Antes existía una cultura en la que muchos empleados podían oponerse a un producto, pero no tenían autoridad para aprobarlo
Ahora la empresa estaba girando hacia una cultura de asumir mayores riesgos y ejecutar más rápido
Al iniciar el proyecto de 100 días, Sissie Hsiao planteó a su equipo un principio peculiar:
“Calidad por encima de velocidad, pero rápido (Quality over speed, but fast)”
Otro alto ejecutivo, James Manyika, desempeñó un papel clave en el cambio profundo de la estrategia de IA
- Doctor en robótica por Oxford y exasesor de McKinsey, se unió a Google en 2022
- Le propuso a Pichai integrar DeepMind y Google Brain
DeepMind (en Londres, dirigido por Demis Hassabis) y Google Brain (en Mountain View, bajo Jeff Dean) operaban por separado y consumían recursos de forma ineficiente
- Tras el lanzamiento de OpenAI, los tres líderes presentaron a la junta un plan de integración
- Hassabis propuso el nombre de proyecto “Titan”, pero fue rechazado, y se adoptó “Gemini”, propuesta de Jeff Dean
Más tarde, Manyika mencionó que Google había tomado decisiones audaces y responsables
- Pero también reconoció que “no siempre había tomado las decisiones correctas”
- En medio de la urgencia, entre los empleados incluso se extendió la ansiedad de que “Google podría terminar como Yahoo”
- Hsiao describió ese momento como “correr un maratón a toda velocidad”
Sin embargo, dos años después, las acciones de Alphabet alcanzaron máximos históricos
- Los inversionistas muestran una perspectiva optimista sobre la recuperación de la competitividad de Google en IA
WIRED evaluó este periodo como la etapa más caótica y de mayor transformación cultural en la historia de Google
- Realizó entrevistas con más de 50 empleados y exempleados de ingeniería, marketing, legal y seguridad, entre otras áreas
- En este artículo, detalla por primera vez la transformación de Google a través del testimonio de altos ejecutivos

Desarrollo de Bard: prioridad total y concentración de recursos

Para responder a ChatGPT, Google inició un nuevo proyecto de chatbot con el nombre clave Bard
Sissie Hsiao reclutó directamente a unas 100 personas talentosas de toda la empresa
- Los gerentes no podían oponerse, y el proyecto Bard era la máxima prioridad
Hsiao seleccionó personas con capacidad técnica, inteligencia emocional y visión de conjunto
La mayoría fue asignada a Mountain View, California, y trabajaba con flexibilidad sin importar su rol formal
- Se enfatizaba la filosofía de que “Team Bard es un equipo que asume cualquier función”
En enero de 2023, Google anunció el primer despido masivo de su historia: unas 12,000 personas, equivalentes al 7% del total
Algunos empleados sufrían por el miedo a ser despedidos si no trabajaban de noche o no asumían tareas extra
- En muchos casos, renunciaban al tiempo de acostar a sus hijos para asistir a reuniones nocturnas
Bard se basaba en LaMDA, pero necesitaba actualizaciones de conocimiento y nuevas medidas de seguridad
- El equipo de infraestructura reasignó a sus mejores especialistas para asegurar servidores y ajustar sistemas
- Los centros de datos casi habían llegado a su límite de consumo eléctrico, con riesgo de sobrecalentamiento del equipo
- Por eso también se desarrollaron rápidamente nuevas herramientas de gestión para manejar la demanda eléctrica de forma más segura
También apareció el humor para aliviar la tensión
- Un integrante del equipo hizo fichas de póker personalizadas con el nombre de cierto chip, las apiló sobre los escritorios de los ingenieros y bromeaba: “Ándale, llévate un chip”
Durante sus primeras semanas, Bard repitió problemas ya conocidos pese al refuerzo de recursos de cómputo
- Al igual que ChatGPT, Bard generaba con frecuencia alucinaciones (hallucination) y respuestas inapropiadas o desagradables
- En las primeras versiones, aparecían con frecuencia estereotipos raciales absurdamente ridículos
  - Si se ingresaba un nombre de origen indio, la mayoría eran descritos como “actores de Bollywood”, y los nombres masculinos de origen chino como “científicos de la computación”
- Según un ex empleado, las respuestas de Bard “no eran peligrosas, pero simplemente eran tontas”
- Algunos empleados compartían capturas de pantalla de las respuestas absurdas de Bard para burlarse de ellas
  - Ejemplo: al pedirle “un rap al estilo Three 6 Mafia sobre tirar baterías de auto al mar”, llegó a generar contenido sobre atar a una persona a una batería y hundirla en el mar
Google no tenía otra opción más que corregir la mayor cantidad posible de errores dentro de los 100 días establecidos
- Incluso personal externo contratado que trabajaba en detección de imágenes de abuso infantil fue asignado a probar Bard
- Pichai pidió a todos los empleados con tiempo disponible que probaran Bard, y al final unas 80,000 personas participaron en las pruebas
Hsiao y la dirección entendían que no podían evitar por completo los errores de Bard, así que presentaron el producto como un “experimento (Experiment)”
- Era una estrategia similar a la de OpenAI al presentar ChatGPT como un “research preview”
- Al recalcar ante usuarios y evaluadores externos que no era un producto terminado, intentaban minimizar el riesgo de daño a la marca
- Este tipo de estrategia ya era una forma ampliamente reconocida en la industria para evitar riesgos desde el caso de Tay, el chatbot de Twitter de Microsoft que terminó haciendo declaraciones nazis

El proceso de lanzamiento de Bard y su error fatal

En el pasado, antes de lanzar productos de IA, el "equipo de innovación responsable" de Google dedicaba meses a revisar sesgos y fallas
- En el caso de Bard, por la presión del calendario, el proceso de revisión se redujo drásticamente
- El director jurídico Kent Walker defendía un lanzamiento rápido
- Los nuevos modelos y funciones aparecían tan rápido que el equipo de revisión no lograba seguir el ritmo ni trabajando horas extra y fines de semana
Hubo advertencias pidiendo retrasar el lanzamiento de Bard, pero fueron ignoradas o neutralizadas
- Sobre esto, Google dijo a WIRED que “ningún equipo recomendó oficialmente oponerse al lanzamiento”
  - Explicó que múltiples equipos participaron en las pruebas y que no existía una estructura en la que un equipo específico fuera completamente responsable
En febrero de 2023, cuando habían transcurrido cerca de 2/3 del proyecto de 100 días, Google obtuvo información de que ChatGPT sería integrado en el buscador Bing
Aunque Google seguía dominando ampliamente la cuota del mercado de búsqueda, la falta de funciones de IA generativa era una amenaza a largo plazo
Para evitar una caída en la acción, el 6 de febrero, un día antes del anuncio de Microsoft, Pichai anunció de forma sorpresiva la apertura de pruebas limitadas de Bard
En el video de marketing, Bard fue descrito como un asistente de IA que heredaba la misión de Google de “organizar la información”
La pregunta del video era: “Entre los nuevos descubrimientos del telescopio espacial James Webb, ¿cuál podrías explicarle a un niño de 9 años?”
- Respuesta de Bard: “JWST tomó la primera foto de un planeta fuera del sistema solar”
Poco después, Reuters informó un error factual: esa imagen no fue tomada por un telescopio espacial, sino por el telescopio terrestre VLT
La acción de Alphabet cayó 9% y se perdieron cerca de 100 mil millones de dólares en capitalización bursátil
Dentro del equipo hubo conmoción
- La empleada de marketing que creó la pregunta se culpó, y sus colegas la consolaron diciéndole: “lo revisaron tanto el equipo legal como el de PR, pero nadie vio el error”
- Como ChatGPT también cometía muchos errores, nadie anticipó que un malentendido aparentemente menor tendría un impacto tan grande en la acción
Xiao lo describió como un “error ingenuo”
- Bard construía sus respuestas con base en resultados de búsqueda de Google, y es posible que malinterpretara la expresión “primera foto” en un blog de la NASA
- El liderazgo subrayó: “nadie será despedido por esto. Pero debemos aprender la lección rápido”
Xiao: “No somos una startup, somos Google. No podemos dejarlo pasar como un defecto técnico. Tenemos que responder con responsabilidad”
Crecía el descontento fuera del equipo de Bard
- En el foro interno Memegen se publicó una crítica: “El lanzamiento de Bard y los despidos fueron apresurados, mal ejecutados y cortoplacistas”
- También se compartió una imagen del logo de Google ardiendo dentro de un basurero
Aun así, Google destinó más recursos a Bard
- Se sumaron cientos de personas más, y en documentos del equipo aparecía todos los días el ícono con la foto de perfil de Pichai, reflejando su involucramiento directo

La llegada de GPT-4 y la brecha tecnológica

A mediados de marzo de 2023, el lanzamiento de GPT-4 de OpenAI provocó otro impacto dentro de Google
- Un investigador senior dijo: “me dejó con la boca abierta y sentí con urgencia que Google tenía que moverse más rápido”
Una semana después, Bard tuvo su lanzamiento oficial en Estados Unidos y Reino Unido
- Los usuarios lo consideraron útil para redactar correos y hacer borradores de reportes
- Pero ChatGPT hacía lo mismo y mejor, así que había pocos incentivos para cambiarse
En el pódcast Hard Fork, Pichai dijo con ironía que Google había “competido con un auto deportivo potente usando un Civic afinado”
- Conclusión: “necesitamos un mejor motor”

Desarrollo de Gemini: la integración de DeepMind y Google Brain, y el choque cultural

Diferencias entre las dos organizaciones de investigación en IA
- DeepMind estaba clasificada como una de las 'Other Bets' de Alphabet y se enfocaba en resolver problemas científicos y matemáticos de largo plazo
- Google Brain desarrollaba sobre todo tecnologías de IA comercialmente prácticas, como el autocompletado de Gmail o el procesamiento de búsquedas ambiguas
Según un exingeniero senior:
- Google Brain se centraba en la autonomía, y Jeff Dean tenía un estilo de “dejar que la gente hiciera las cosas por su cuenta”
- En cambio, DeepMind operaba como un ejército altamente coordinado, y Demis Hassabis dirigía una “organización de alta eficiencia bajo un mando unificado”
Dean es un veterano de la investigación en redes neuronales y ha estado en Google desde sus primeros años
Hassabis es un líder guiado por una visión, que sueña con curar enfermedades mediante la IA y trabaja en la idea de agentes de IA que vean, escuchen y ayuden
Nace Google DeepMind (GDM)
- En abril de 2023, Google fusionó ambas organizaciones y lanzó Google DeepMind (GDM)
  - Hassabis fue nombrado CEO de la organización fusionada
  - El ambiente interno era: “volvió el propósito” y “se acabó el juego”
- Para construir rápidamente el modelo Gemini, fue necesaria una colaboración a través de 8 zonas horarias
- Se crearon cientos de salas de chat y se afianzó una cultura de trabajo nocturno
  - Hassabis: “cada día se siente como una vida entera”
- GDM se trasladó a un edificio seguro en Mountain View llamado Gradient Canopy
  - Una estructura con forma de domo, rodeada de esculturas artísticas
  - En el mismo piso estaba la oficina del CEO Pichai
- Sergey Brin (cofundador de Google) lo visitaba con frecuencia para animar al equipo
- Se pidió aumentar los días de trabajo presencial, y los empleados comunes de Google no podían entrar a ese edificio
- Incluso el código central de GDM era inaccesible para otras organizaciones
A medida que el proyecto Gemini absorbía los recursos de Google, investigadores de otras áreas, como salud y cambio climático, sufrían por la falta de servidores
También hubo restricciones para publicar papers, lo que elevó el descontento, ya que para los investigadores los artículos son un activo central de su carrera
- Google endureció esas restricciones por temor a filtraciones de información hacia OpenAI
- La receta de entrenamiento de Gemini era un activo clave para la supervivencia de la empresa
Gemini también enfrentó problemas similares a los de Bard
Amin Vahdat, vicepresidente de aprendizaje automático y Cloud AI en Google:
- “Cuando escalas 10 veces, todo se rompe”
Antes del lanzamiento, Vahdat armó un war room dedicado para concentrarse en resolver bugs y fallas del sistema

Última revisión antes del lanzamiento de Gemini y dilemas éticos

El equipo de desarrollo responsable de Google DeepMind (GDM) se volcó por completo a la revisión del producto antes del lanzamiento de Gemini
- El modelo era potente, pero todavía generaba en algunos casos respuestas extrañas o inapropiadas
Según un informe publicado:
- Hacían falta mejoras especialmente en consejos médicos y respuestas relacionadas con acoso
- Al recibir imágenes, surgía el problema de hacer inferencias sin fundamento ante preguntas como “¿cuál es el nivel educativo de esta persona?”
La directora de innovación responsable Dawn Bloxwich concluyó que eso “no llegaba al nivel de impedir el lanzamiento”
- Pero no hubo tiempo suficiente para prever las formas creativas (o extrañas) en que el público podría usarlo
En este punto, Google podría haber bajado la velocidad, pero no lo hizo
- OpenAI ya se había convertido en el “Kleenex de la IA” y estaba captando atención global
- ChatGPT se volvió un símbolo tanto de la promesa tecnológica como de los problemas sociales
- Los trabajadores sentían amenaza sobre sus empleos, y los creadores exigían compensación por la extracción de sus datos
- Los padres entendían que los chatbots podían transmitir contenido inapropiado a sus hijos
- Entre investigadores de IA se discutía el “p(doom)”, es decir, la probabilidad de que la tecnología amenace a la humanidad
El legendario científico de IA de Google Geoffrey Hinton renunció en mayo de 2023 por preocupaciones éticas
- Advirtió que la IA podría amenazar a la humanidad mediante desinformación y venenos sofisticados
Hassabis también sentía que hacía falta más tiempo, pero aun así siguió avanzando hacia su sueño de un asistente de IA universal y de curar enfermedades

La presentación de Gemini y su primer éxito

Diciembre de 2023: Google presentó oficialmente Gemini
- Las acciones subieron tras el lanzamiento
- Superó a ChatGPT en 30 de 32 pruebas de referencia estándar
- Análisis de artículos académicos y videos de YouTube, con mejoras en la capacidad para responder preguntas de matemáticas y derecho
Hassabis organizó una pequeña fiesta de celebración en la oficina de Londres
- Luego recordó: “No soy bueno para celebrar. Siempre estoy pensando en lo siguiente”
Ese mismo mes, Jeff Dean fue invitado a una nueva sala de chat llamada Goldfish, donde conoció el siguiente avance técnico
- El nombre era una broma, pero el contenido era lo opuesto: desarrollar una versión de Gemini con memoria prolongada
Mediante procesamiento distribuido en redes de chips de alta velocidad, podía analizar miles de páginas de texto o incluso una serie completa de TV
- Esta tecnología se conoce como “long context”
Dean, Hassabis y Manica buscaron cómo integrarlo en la familia de productos de IA de Google
La función que Manica quería primero: resumir automáticamente PDFs en formato de pódcast
- Le dijo a WIRED que “es difícil seguir todos los artículos que se publican cada semana en arXiv”

Estabilidad tras la transición a Gemini y una nueva crisis

Un año después del código rojo, el ambiente en Google empezó a recuperarse
- Los inversionistas se calmaron y Bard y LaMDA se unificaron bajo una sola marca: “Gemini”
El equipo de Sissie Hsiao redujo la brecha con OpenAI al desarrollar funciones de generación de texto a imagen
También estaba en preparación una nueva función llamada Gemini Live
- Permitía que los usuarios mantuvieran conversaciones largas como con un amigo o consejero
Gracias a modelos Gemini más potentes, los ejecutivos recuperaron la confianza
Incluso en ese clima de estabilización, el CEO Pichai ordenó más reestructuraciones
- Los ingresos por publicidad subieron, pero no alcanzaron las expectativas de Wall Street
- Hasta responsables de privacidad y compliance fueron expulsados
  - La salida de altos cargos encargados de proteger a los usuarios fue interpretada como el mensaje de que “se permiten las preocupaciones, pero no bloquear el avance”
El generador de imágenes en sí fue fácil de construir, pero la revisión era un trabajo repetitivo y pesado de pruebas
- Había que redactar prompts de filtrado para evitar respuestas problemáticas
Como no todos los empleados podían acceder a las pruebas, la carga excesiva recayó en unas pocas personas
- Ejemplo: con el prompt “rapist”, se generaban con más frecuencia personas de piel oscura → preocupación por sesgo racial
- Hubo incluso pedidos internos para bloquear por completo la generación de imágenes de personas, pero fueron ignorados
Un exrevisor recordó que “el ambiente era lanzar sí o sí”
- Algunos revisores renunciaron porque sus preocupaciones no fueron tomadas en cuenta
En febrero de 2024, el generador de imágenes se lanzó oficialmente dentro de la app de Gemini
- Casi no aparecieron los problemas previstos de imágenes racistas o sexistas, pero surgió otro problema en la dirección opuesta
Ejemplo: al pedir una imagen de “senadores estadounidenses del siglo XIX”, generaba imágenes de una mujer negra, un hombre asiático y una mujer indígena
- No aparecía ningún hombre blanco
Un caso aún más impactante: soldados de la Alemania nazi generados como personas de color
Ante esto, legisladores republicanos de EE. UU. y Elon Musk, entre otros, criticaron con dureza la “woke AI” de Google
- Musk señaló por su nombre a miembros del equipo y los atacó de forma concentrada; un empleado cerró sus cuentas en redes sociales y temió por su seguridad personal
Google suspendió por completo la generación de imágenes de personas, y las acciones de Alphabet volvieron a caer
Justo después de la polémica, decenas de ejecutivos de Google iniciaron conversaciones de emergencia
- Vicepresidentes y directores volaron a Londres para reunirse cara a cara con Hassabis
Resultado:
- Tanto el equipo de Hassabis (modelo Gemini) como el equipo de Hsiao (app Gemini) obtuvieron aprobación para contratar especialistas en confiabilidad y seguridad
- Se crearon 15 nuevos puestos relacionados con Trust & Safety
En la sede de Gradient Canopy, Sissie Hsiao dio a su equipo tiempo suficiente para resolver los problemas del generador de imágenes
Junto con James Manica, estableció de nuevo principios públicos para Gemini
Todos esos principios fueron redactados con expresiones centradas en el usuario (“you”):
- Gemini “sigue tus instrucciones”
- “Se ajusta a tus necesidades”
- “Protege tu experiencia”
Uno de los énfasis centrales:
- “Las respuestas de Gemini pueden no reflejar las posturas o creencias de Google”
- “Los resultados de Gemini se basan en gran medida en lo que tú pediste; Gemini es algo que tú creaste”
Esto funcionaba como un mecanismo lógico para minimizar la responsabilidad de Google si surgían problemas más adelante
Pero Google no explicó con claridad cómo se haría responsable por sí misma bajo esos principios

Experimento de pódcast con IA: Westminster Watch

Hacia las 6:30 p. m. de una tarde de marzo de 2024, se presentó un experimento interesante en la Yellow Zone de Gradient Canopy
Dos empleados de Google Labs le mostraron un nuevo proyecto a Josh Woodward
- Woodward dirige Google Labs, el grupo de Google que lanza rápidamente nuevos productos experimentales
El proyecto consistía en:
- usar transcripciones de sesiones del Parlamento británico y Gemini con capacidad de long context
- para generar el pódcast “Westminster Watch”, conducido por los presentadores de IA Kath y Simon
En el primer episodio, Simon abre diciendo:
- “Esta semana también hubo bastante drama, debate e incluso un poco de historia en la Cámara”
Woodward quedó profundamente impresionado por el experimento y luego lo compartió directamente con figuras clave, incluido Pichai

Resúmenes de audio con IA, innovación en búsqueda y otra polémica

La función NotebookLM Audio Overviews, que permite a la IA resumir documentos o actas de reuniones en formato de pódcast, fue presentada oficialmente en Google I/O de mayo de 2024
Según Josh Woodward, el equipo principal probó miles de pódcasts generados por IA día y noche mientras avanzaba el desarrollo
Sin embargo, en el evento de presentación otras dos novedades atrajeron más atención:
- Astra: un asistente de IA de próxima generación capaz de analizar video en tiempo real (Brin lo demostró personalmente)
- AI Overviews: una función que resume los resultados de búsqueda y los muestra en la parte superior de la página
El equipo de Project Magi desarrolló AI Overviews para resumir resultados de búsqueda y mostrarlos en un cuadro de resumen (Box)
El equipo inicial de innovación responsable pidió supervisión por preocupaciones sobre sesgos, problemas de precisión e impacto ético por la caída del tráfico
- Pero el proyecto terminó siendo difícil de supervisar de forma sistemática debido a la reorganización del equipo y al trabajo distribuido
Tras el lanzamiento, surgieron numerosos casos de respuestas extrañas:
- “¿Cuántas piedras debería comer al día?” → “Según geólogos de UC Berkeley, se recomienda consumir una piedra pequeña al día”
- “El queso no se pega a la pizza” → “Agrega 1/8 de taza de pegamento no tóxico a la salsa”
Estas respuestas provenían en su mayoría de bromas de Reddit y otros memes de internet, pero
AI Overviews las presentó como hechos, generando problemas de credibilidad
Google redujo temporalmente la exposición de la función mientras la reajustaba
Reacción interna de Google y comentarios de los usuarios
- El científico principal de Search, Pandu Nayak:
  - “No se puede prevenir todo problema de antemano. Lo único que podemos prometer es una mejora continua”
  - “Cuando algo funciona bien, la gente se queda callada; cuando sale raro, solo se queja”
- Internamente, empleados que ya habían planteado dudas sobre la precisión quedaron decepcionados
  - Desde Bard→Gemini hasta el generador de imágenes y AI Overviews, lo calificaron como una “cadena de generadores de ficción”
  - También surgió la preocupación de que la misión de Google de mejorar el acceso a la información se estuviera convirtiendo en una “herramienta para dictar tonterías”
- En cambio, el equipo de Search puso el foco en la satisfacción del usuario
  - AI Overviews se mantuvo ampliamente activo sin opción para desactivarlo
  - Después, las funciones de resumen con IA también se incorporaron a Google Maps, la app del clima y otros productos
- Ejemplo de la app del clima para Pixel:
  - Aunque algunos ingenieros opinaban que los gráficos existentes eran suficientes, las pruebas mostraron que el 90% dio feedback de “me gusta”
Señales de recuperación y regreso de talentos
- En diciembre de 2024, dos años después del impacto de ChatGPT, Jeff Dean dio una entrevista a WIRED con un tono positivo
  - El modelo Gemini alcanzó el primer lugar en benchmarks públicos
  - Un ejecutivo contó que en el trayecto al trabajo habla con Gemini Live en lugar de con su hermana
- El CEO de NVIDIA, Jensen Huang, recomendó con fuerza NotebookLM Audio Overviews
- Incluso talentos que se habían ido por frustración con la antigua cultura cautelosa regresaron
  - Noam Shazeer, uno de los creadores de Transformer, también volvió a sumarse
    - En el pasado había renunciado decepcionado por la política de la empresa de no lanzar LaMDA al exterior

El futuro de Gemini, los desafíos y la continuidad de la guerra de la IA

Ambiente interno de Google y confianza en el crecimiento
- En la entrevista, Jeff Dean reconoció errores de juicio del pasado y evaluó que ahora Google está dejando atrás la aversión al riesgo y avanzando más
- Actualmente, los siete principales servicios de Google (Chrome, Gmail, YouTube, etc.) están incorporando funciones basadas en Gemini
- Dean, Noam Shazeer y otros líderes están coordinando requerimientos de toda la empresa:
  - mejorar la traducción al japonés
  - fortalecer las capacidades de programación
  - mejorar el análisis de video en tiempo real que se usará en Astra, entre otros
- Dean y Shazeer se reúnen con frecuencia en la microkitchen de Gradient Canopy para compartir ideas
Expansión de la estrategia hacia la generación de contenido con IA
- Shazeer: “Organizar información es un mercado de 1 billón de dólares, pero lo realmente cool ahora es el de 1 cuatrillón (Quadrillion) de dólares”
- La acción de Alphabet casi se duplicó frente a su punto más bajo al momento del debut de ChatGPT
- Hassabis ahora también supervisa el equipo de la app Gemini de Xiao y está convencido de que el futuro en el que la IA cure enfermedades no está lejos
  - Le dijo a WIRED: “Tenemos la base de investigación más amplia y profunda de cualquier organización”
Problemas de rentabilidad y regreso al modelo publicitario
- Actualmente, la mayoría de los usuarios no está dispuesta a pagar directamente por funciones de IA
- Google está considerando insertar anuncios en la app Gemini
- Es una estrategia tradicional de Silicon Valley:
  - “Danos tus datos, tu tiempo y tu atención, y usa gratis la increíble herramienta que construimos”
  - Con solo marcar la casilla de exención de responsabilidad, Google no asume ninguna responsabilidad
Competencia de mercado y carga de infraestructura
- Datos de Sensor Tower:
  - descargas acumuladas de la app ChatGPT: cerca de 600 millones
  - app Gemini: cerca de 140 millones
- Hay numerosos competidores en IA:
  - Claude, Copilot, Grok, DeepSeek, Llama, Perplexity, entre otros
  - Muchos de ellos son competidores directos de Google o empresas en las que ha invertido
- La IA generativa requiere inversiones de miles de millones de dólares y un consumo energético enorme
  - A tal nivel que obliga a extender la vida útil de viejas plantas de carbón o reactores nucleares
  - Toda la industria aún no encuentra con claridad una forma de monetizarla
Riesgos adicionales que enfrenta Google
- En los próximos años, hasta el 25% de los ingresos publicitarios de Search podría perderse por demandas antimonopolio (análisis de JP Morgan)
- Incluso internamente hay una fuerte conciencia de la presión por compensar financieramente esa situación
  - Parte del equipo de Xiao ha trabajado tres años seguidos sin vacaciones de invierno
  - El cofundador Brin comentó recientemente a los empleados que trabajar 60 horas por semana es el sweet spot más efectivo en la competencia de IA
- Empleados entrevistados por WIRED: hay una profunda ansiedad por los despidos continuos, el burnout y los riesgos legales
Obsesión con la AGI y desafíos filosóficos
- Hassabis sigue aferrado al objetivo de desarrollar AGI (inteligencia artificial general)
  - Caminando por Londres con un prototipo de Astra, imagina un futuro en el que pueda reconocer todo lo que hay en el mundo
- Pero la AGI solo será posible si mejoran al mismo tiempo el razonamiento, la planificación y la capacidad de ejecución
Competencia con OpenAI en la 'IA agente'
- En enero de 2025, OpenAI presentó Operator
  - Una IA agente capaz de hacer clic y escribir en sitios web reales para realizar tareas por el usuario
  - Puede reservar viajes o completar formularios, pero es lenta y comete muchos errores
  - Precio: 200 dólares al mes
- Google también está ampliando funciones en esa misma dirección:
  - Hoy Gemini puede armarte una dieta, pero en versiones futuras pondrá ingredientes en el carrito de compras,
    y la siguiente etapa apunta incluso a dar feedback en tiempo real mientras cortas cebolla
Los errores se repetirán, pero la velocidad no se detendrá
- En enero de 2025, en un anuncio del Super Bowl Gemini respondió erróneamente que “más de la mitad del consumo mundial de queso corresponde al gouda”
- Pero Google está haciendo crecer a Gemini no como una simple máquina de información, sino como parte de la vida, coach personal y asistente todoterreno
- Pichai dijo: “Estamos avanzando con cuidado”
- Pero él y la directiva, una vez que lleguen a la cima, jamás querrán quedarse atrás otra vez
La competencia en IA continúa

4 comentarios

joone 2025-05-24

Pero, ¿cómo terminan convirtiéndose en noticia historias como esta? Parece más bien un texto medio promocional de Google.
"Estamos trabajando duro"...

halfenif 2025-03-28

Se siente como ver una serie de TV.

Pero entonces, ¿dónde quedó Apple?

ide127 2025-03-28

Parece aquella época cuando recibieron el shock del Sputnik.

GN⁺ 2025-03-28

Opiniones de Hacker News

Al principio era escéptico, pero creo que Google lo está haciendo bien en la competencia con OpenAI. Gemini 2.0 Pro y los modelos Flash son excelentes. La función de investigación profunda está bien implementada. La ventana de contexto sigue siendo la mejor de la industria. La integración con Search, Gmail, la suite de oficina de Google, Google Meet, Android y demás es sobresaliente
- Ahora tiene modelos suficientemente buenos y ya está profundamente posicionado en su portafolio de productos existente, su infraestructura en la nube y la vida laboral moderna
- A diferencia de Apple, tiene menos restricciones para acceder a datos de entrenamiento gracias a políticas de privacidad menos estrictas
El mayor problema que enfrenta Google es el impulso por introducir modelos ligeros para todo el mundo. Es probable que el modelo que usa en Search esté cerca del nivel de un modelo de 8B, y Flash 2.0 está bien, pero sigue siendo un modelo ligero
- La gente ahora asocia Google AI/Gemini con resultados de búsqueda deficientes y malas respuestas
- En cambio, sus modelos de vanguardia son potentes, y Gemini 2.5 podría haber tomado el trono de la IA
OpenAI no es una empresa pública y no genera ganancias. Google sí genera ganancias. Aun así, al igual que con Google Meet/Zoom, fue un error no haber llevado a producción los decodificadores Transformer. (Los codificadores como BERT sí se usan ampliamente)
El liderazgo de Google está adoptando un enfoque cauteloso, y los lanzamientos de productos se ven más pulidos. Se siente como esa atractiva transición de 0 a 1 al estilo de Apple en los 2000
El principal problema de Google es que varios grupos crean el mismo producto y compiten por la atención de los usuarios
- Hay muchos productos: Google AI Studio, la app de Gemini, la app de Gemini para usuarios de Gemini Advanced, Vertex AI, NotebookLM, etc.
- Se compara con ChatGPT.com
- Search Google. Búsqueda. Si hoy fuera tan simple como mostrar los resultados de búsqueda en la columna derecha junto con anuncios y poner Gemini a la izquierda, sería sencillo
Como pequeño inversionista: creo que Alphabet/Google podría hacerlo mejor con un CEO que no sea Sundar
- También: habría que considerar invertir en una empresa que opere servicios que impulsen suscripciones (por ejemplo, YouTube Premium, antes Netflix)
El problema de Google es que la gente poco familiarizada con la tecnología ha empezado a ver la IA como algo distinto de Google (búsqueda) y de sus otros productos
- Intentan usar IA en lugar de búsqueda (por ejemplo, ChatGPT), y Google está perdiendo esta guerra de percepción. No es un problema que pueda resolverse rápidamente
- Lo que Google ha hecho en IA para el público general fue Bard (¿alguien lo recuerda?), y ahora eso se convirtió en Gemini
- ¿Cuál es el diferenciador? ¿Que Google ofrece más servicios gratuitos que sus competidores? A la gente común no le importa si resuelve problemas de matemáticas
- Mientras la gente piense en la IA y la búsqueda como cosas separadas, Google va a tener problemas
¿Has conocido a algún Googler que tenga confianza en la estrategia de IA de Google? Todos con los que he hablado parecen tener preocupaciones serias, aunque puede ser una muestra pequeña
Creo que Eric Schmidt dijo hace unos 10 años que "todos necesitarán un asistente" (quizá por 2016). No entiendo por qué no hicieron eso, aun cuando podían haber implementado algo como una conversación. En cambio, se obsesionaron con cosas relacionadas con el buzón de correo y demás

La revolución de IA de Google: dos años de lucha para alcanzar a OpenAI

El inicio de la crisis de Google tras quedar rezagado en la revolución de los chatbots

La respuesta de Google a la crisis de IA y el cambio de estrategia

Desarrollo de Bard: prioridad total y concentración de recursos

El proceso de lanzamiento de Bard y su error fatal

La llegada de GPT-4 y la brecha tecnológica

Desarrollo de Gemini: la integración de DeepMind y Google Brain, y el choque cultural

Nace Google DeepMind (GDM)

Última revisión antes del lanzamiento de Gemini y dilemas éticos

La presentación de Gemini y su primer éxito

Estabilidad tras la transición a Gemini y una nueva crisis

Experimento de pódcast con IA: Westminster Watch

Resúmenes de audio con IA, innovación en búsqueda y otra polémica

Reacción interna de Google y comentarios de los usuarios

Señales de recuperación y regreso de talentos

El futuro de Gemini, los desafíos y la continuidad de la guerra de la IA

Ambiente interno de Google y confianza en el crecimiento

Expansión de la estrategia hacia la generación de contenido con IA

Problemas de rentabilidad y regreso al modelo publicitario

Competencia de mercado y carga de infraestructura

Riesgos adicionales que enfrenta Google

Obsesión con la AGI y desafíos filosóficos

Competencia con OpenAI en la 'IA agente'

Los errores se repetirán, pero la velocidad no se detendrá

Lecturas relacionadas

4 comentarios

Opiniones de Hacker News