Google revela por primera vez el consumo energético de los prompts de IA
(technologyreview.com)- Google reveló el consumo de electricidad, agua y emisiones de carbono de su app Gemini al procesar prompts, presentando los primeros datos concretos sobre el uso energético de la IA
- Un prompt de texto promedio consume 0.24 Wh de electricidad, similar a usar un microondas durante 1 segundo, y genera 0.26 ml de agua y 0.03 g de dióxido de carbono
- Estas cifras provienen de un análisis integral que incluye toda la infraestructura, como chips de IA (58%), CPU y memoria (25%), equipos de respaldo (10%) y operación del centro de datos (8%)
- En mayo de 2025, en comparación con mayo de 2024, la eficiencia energética mejoró 33 veces, y Google atribuyó esto a la optimización de software y a mejoras del modelo
- Este anuncio es significativo por la mayor transparencia de las grandes empresas de IA, pero como todavía no se divulgan datos clave como el número total de consultas, también se plantea la necesidad de un sistema estandarizado de evaluación energética para la IA
Google revela el uso energético de los prompts de Gemini
- Google es la primera gran empresa de IA en revelar el consumo de electricidad, emisiones de carbono y uso de agua de los modelos Gemini al procesar prompts de texto
- Un prompt promedio genera 0.24 Wh de electricidad, 0.26 ml de agua y 0.03 g de CO₂, algo comparable a 1 segundo de funcionamiento de un microondas o cinco gotas de agua
- El anuncio explicó los datos detallados y el método de cálculo a través de una entrevista con MIT Technology Review
Estructura detallada del consumo energético
- Del consumo total de electricidad, los chips de IA (TPU) representan el 58%, la CPU y la memoria el 25%, los equipos de respaldo el 10% y la operación del centro de datos (refrigeración y conversión de energía) el 8%
- Google explicó que realizó el análisis de manera integral, incluyendo toda la infraestructura de hardware
- Se considera una contribución de investigación para la industria, ya que revela datos internos a los que los investigadores suelen tener difícil acceso
Diferencias entre prompts y limitaciones
- Las cifras publicadas son la mediana (median), por lo que algunas consultas pueden consumir mucha más energía
- Ejemplo: resumir decenas de libros o realizar operaciones complejas con modelos de reasoning
- Este informe solo analizó prompts de texto y no incluyó la generación de imágenes ni video
- Por lo tanto, sigue habiendo limitaciones para entender el volumen total real del uso de Gemini
Mejora de eficiencia y estimación de emisiones de carbono
- Google anunció que, en mayo de 2025 frente a mayo de 2024, el consumo energético por prompt se redujo 33 veces
- Esto se explica como resultado de mejoras en la arquitectura del modelo y de la optimización de software
- La estimación de emisiones no utilizó el promedio de la red eléctrica de EE. UU., sino un enfoque basado en mercado que refleja la proporción de energía limpia comprada por Google, por lo que se calculó en aproximadamente 1/3 del nivel de una red eléctrica general
Reacción de investigadores e industria
- Integrantes del proyecto ML.Energy de la University of Michigan calificaron este anuncio como el análisis más integral e importante
- Investigadores de Hugging Face destacaron la necesidad de un sistema estandarizado de clasificación energética para la IA y señalaron que, por ahora, las empresas solo revelan información de forma selectiva
- Este informe amplió la comprensión sobre el consumo real de recursos del uso de IA, pero la falta de datos clave como el número total de consultas sigue siendo una gran limitación
1 comentarios
Comentarios de Hacker News
No pude encontrar en el artículo original los enlaces al comunicado y al informe relacionados, así que los adjunto directamente.
Cuando veo notas sobre sobrecarga de la infraestructura eléctrica, siento que hay una especie de estrategia de “dog whistle” para enfatizar la idea de que las empresas tecnológicas son malas para el medio ambiente.
Se cuestiona el uso de agua y electricidad, pero tienden a presentarlo de forma demasiado sensacionalista.
Un caso representativo es la crítica al consumo de agua del centro de datos de Dalles.
Esos edificios están junto al río Columbia, y cerca está la presa de Dalles, que genera en promedio 700 megavatios.
Usan agua del río para enfriamiento y luego la devuelven al río un poco más caliente.
En cierto modo, es como devolver el calor que el agua se iba a llevar de todas formas al fluir cuesta abajo, así que no es un desperdicio total.
Artículo relacionado, información sobre la presa de Dalles
El PDF del informe técnico oficial de Google puede verse aquí.
Me pregunto por qué publicaron el consumo energético del prompt mediano y no el promedio.
El promedio mostraría de forma más intuitiva el consumo medio real.
En cuanto a los EVs, nunca fue realista esperar que los autos eléctricos se volvieran dominantes para 2030.
No había ninguna preparación, ni en expansión de producción de baterías ni en infraestructura.
Los centros de datos pueden generar de repente una necesidad de grandes cantidades de energía en una región pequeña y específica.
Otros rubros, como los EVs o las bombas de calor, se adoptan gradualmente, así que se puede responder con pequeños aumentos anuales de capacidad.
Los centros de datos son más difíciles de distribuir, por lo que la carga sobre la infraestructura es mayor.
Hace poco me sorprendió escuchar a gente de la Gen Z decir que la IA está “destruyendo” el agua.
He trabajado en centros de datos, así que sabía que usaban agua para enfriamiento, pero nunca me dio la impresión de que estuvieran destruyendo agua a gran escala.
La percepción sobre GenAI y el agua es más profunda de lo que pensaba.
Incluso hubo quienes hablaban como si “por culpa de la IA vamos a vivir en un infierno de sequía”.
A mí más bien me da curiosidad cuánta energía consume un solo video de TikTok, pero esa comparación parece ir por otro lado.
Cuando pregunto por qué mecanismo el agua realmente desaparecería, si sería como vapor, me sorprende que mucha gente asuma que si se evapora entonces “desapareció para siempre”.
Las moléculas de agua no se “destruyen”, pero muchas veces sí desaparecen por completo de un lugar donde podían usarse de manera útil.
El mar de Aral es un caso representativo de desaparición por riego agrícola.
Video de YouTube
La escasez de agua es un fenómeno extremadamente local.
Por ejemplo, operar un centro de datos en Arizona sí puede generar un problema real de agua, aunque puede mitigarse con reutilización de aguas residuales y medidas similares.
La planta Palo Verde también usa aguas residuales en sus intercambiadores de calor.
A mí también me sorprendió que recientemente me preguntaran sobre el consumo de agua de la IA.
Hice una búsqueda rápida y resulta que los centros de datos sí consumen bastante más agua de lo que imaginaba: alrededor de 1 litro por cada 1 kWh de electricidad.
He oído que los hyperscalers logran mejores cifras y buscan ser net positive, pero casi no hay material que diga que ese valor en sí sea ficticio.
“1 litro/kWh” es difícil de dimensionar, pero para un gran centro de datos eso serían 278 L/s. Un cabezal de ducha usa 0.16 L/s, y toda la industria de almendras de California consume en promedio anual 200 mil L/s.
Sería equivalente a unas 4 millas cuadradas de cultivo de almendras, pero no me parece algo tan extremo en la práctica, y supongo que los datos de los hyperscalers serán mejores.
Los centros de datos usan enfriamiento evaporativo.
No es simplemente calentar el agua y devolverla, sino evaporarla por completo a través de la atmósfera.
(Las moléculas de agua siguen ahí, pero el vapor en la atmósfera queda en una forma difícil de reutilizar).
La idea de que la IA destruye agua empezó como un argumento NIMBY y luego fue absorbida como una razón anti-IA por grupos de la Gen Z con una fuerte inclinación anticapitalista.
En 2011 Google dijo que usaba 0.3 Wh por consulta de búsqueda, y a principios de este año Sam Altman también dijo que una consulta de OpenAI promedia 0.3 Wh.
Me sorprende que ambas cifras sean tan parecidas.
Pensaba que una consulta a un LLM sería más intensiva en energía que una búsqueda simple en Google, pero esto hace notar lo gigantesca que ya era la infraestructura de Google Search.
Por ejemplo, para una pregunta simple como el significado de una palabra, si un LLM pequeño corriera en un iPhone, 0.03 Wh serían suficientes, o sea 10 veces menos que una búsqueda en Google.
(Asumiendo que el chip A16 corre a 5 vatios durante 20 segundos, eso da 0.03 Wh).
Lo que me pregunto aquí es si el costo de entrenamiento —especialmente las corridas fallidas— está incluido en este tipo de estimaciones.
Post oficial del blog de Google
Vale la pena considerar también cuánto han influido 14 años de avances en eficiencia energética.
Alrededor de 2008, el proceso central de búsqueda consistía en hacer
grepsobre todos los documentos.Los documentos se cargaban en RAM de forma distribuida y se ejecutaba
grepa través de 1000 máquinas.Los índices invertidos no se usaban mucho porque no eran adecuados para consultas “donde importa el orden de las palabras”.
El proceso de ranking y demás era más complejo.
0.3 Wh son 1080 joules. Un litro de gasolina contiene más de 30 millones de joules, así que en realidad equivale a 0.034 mililitros de gasolina.
Claro, la electricidad es muchísimo más eficiente que un motor de combustión interna.
Cuando le hago una consulta a mi LLM local, siento que las luces de la oficina parpadean y que consume más energía que prender el horno durante 1 segundo.
Me pregunto si por allá de 2008 Google ya usaba búsqueda basada en deep learning.
Da la impresión de que el consumo eléctrico por consulta debió haber variado con la introducción de funciones nuevas.
Me decepciona que el informe completo no explique qué tipo de prompt corresponde a la “mediana”.
También me gustaría saber cuántos tokens tiene, cómo es la distribución de longitudes y si eso se mantiene igual entre años.
Sin esa información, indicar solo la mediana no tiene mucho valor práctico.
Si dieran el promedio, al menos se podría estimar el uso total multiplicándolo por el número de consultas.
Sam Altman también reveló recientemente en su blog el consumo promedio de energía por consulta de ChatGPT.
Una consulta de ChatGPT consume en promedio 0.34 Wh, equivalente a 1.5 segundos de horno o al uso de agua de unos minutos de un foco de alta eficiencia.
El consumo de agua es de 0.000085 galones por consulta (una quinceava parte de una cucharadita).
Blog de Altman
Personalmente, creo que lo realmente importante no es la inferencia, sino el entrenamiento, el fine-tuning y el scraping de datos.
La idea de que “los prompts destruyen el medio ambiente” me pareció demasiado sensacionalista.
Me alegra ver que cada vez se hace mejor fact-checking.
Pero en la práctica tampoco se puede ignorar el impacto que los nuevos centros de datos tienen sobre la red de transmisión y distribución.
Si la tecnología fuera fundamentalmente tan eficiente energéticamente, probablemente no veríamos a las grandes empresas invirtiendo en plantas nucleares privadas ni compitiendo por energía como ahora.
Para fijar bien el criterio, no basta con ver el consumo total de agua y energía; habría que evaluar de forma relativa si la región en cuestión tiene suficientes recursos hídricos y energéticos.
Google reporta oficialmente el uso total de agua de todos sus centros de datos.
Para 2024, fueron unos 10 mil millones de galones (alrededor de 0.03% del uso total de EE. UU., considerando además que no todos sus centros de datos están en ese país).
La cifra en sí no parece enorme, pero solo en Council Bluffs, IA, supera los mil millones de galones, y habría que verificar si el ecosistema local puede soportarlo y si se está gestionando con responsabilidad.
Google reconoce que 28% de su uso ocurre en “áreas con riesgo medio o mayor de agotamiento o escasez de agua”.
Reporte ambiental 2025 de Google
Incluso con solo entrar a un sitio web, se envían prompts al servidor sin querer.
Da pena que, mientras más barato se vuelve ofrecer estos servicios a gran escala, más tienden a sobreusarse.
No estoy de acuerdo con la idea de que, si el consumo energético fuera realmente bajo, no habría tanta competencia por nuevos centros de datos e infraestructura energética.
La red eléctrica de EE. UU. lleva mucho tiempo sin capacidad excedente adicional.
Esto se debe a mejoras en eficiencia energética y a la desindustrialización.
Más que los centros de datos en sí, el problema mayor es la infraestructura de distribución eléctrica.
La generación puede existir, pero hay muchos problemas para distribuirla hasta donde se necesita.
Incluso la polémica sobre plantas privadas tiene más que ver con distribución que con generación.
Si el prompt mediano consume 0.24 Wh, entonces equivale a la energía de:
Si mis cálculos están bien, con 1 kWh se podrían hacer unas 4 mil consultas.
Si tomamos una tarifa industrial de $0.04/kWh, entonces con $1 se podrían hacer 100 mil consultas.
Si se consideran también los costos de construir el centro de datos y demás, una suscripción de $20 al mes no parece exageradamente cara.
¿Habré hecho bien la cuenta?
Sí, la cuenta está bien.
El error fundamental del pesimismo sobre energía y agua en IA es que electricidad, agua y terreno al final se traducen en costos, y aun así la IA se está ofreciendo casi gratis.
Si de verdad la IA se estuviera comiendo toda la electricidad y toda el agua, las empresas no la operarían perdiendo dinero nada más.
Pero ¿no habría que considerar aparte el costo del entrenamiento?
Si quieren saltarse los artículos de terceros, pueden ver directamente el post del blog de Google y el PDF del paper oficial.
Me interesa más conocer el volumen total, como la cantidad diaria total de consultas de Gemini.
Solo con la cifra del prompt mediano no se puede estimar la demanda energética total.
Sin el número total de consultas, la mediana por sí sola no dice mucho.
Tal vez no lo publican porque el promedio es más alto.