WeatherNext 2: el modelo de predicción meteorológica más avanzado de Google DeepMind

(blog.google)

5 puntos por GN⁺ 2025-11-19 | 1 comentarios | Compartir por WhatsApp

WeatherNext 2 es un modelo basado en IA que mejora significativamente la precisión y la eficiencia de la predicción meteorológica global
Genera cientos de escenarios meteorológicos en menos de un minuto en una sola TPU, y ofrece una velocidad de predicción 8 veces mayor que los modelos existentes
Mediante una nueva arquitectura de Functional Generative Network (FGN), mantiene predicciones físicamente consistentes y admite resolución horaria
Los datos de predicción están disponibles en Earth Engine y BigQuery, y ofrece capacidades de inferencia personalizada a través del programa de acceso anticipado de Vertex AI
Esta tecnología mejora las funciones meteorológicas en los servicios de Google, incluidos Search, Gemini, Pixel Weather y Google Maps Platform

Resumen de WeatherNext 2

Google DeepMind y Google Research desarrollaron conjuntamente WeatherNext 2, un modelo de predicción meteorológica basado en IA que ofrece una velocidad 8 veces mayor y resolución por hora frente a generaciones anteriores
- Genera cientos de escenarios meteorológicos posibles a partir de una sola entrada
- La predicción se completa en menos de un minuto en una sola TPU, mientras que los modelos físicos basados en supercomputadoras existentes requieren horas
Este modelo muestra un rendimiento superior al de versiones anteriores en 99.9% de las variables y horizontes de pronóstico (de 0 a 15 días), incluidos temperatura, velocidad del viento y humedad
WeatherNext 2 hace posible la predicción de alta resolución a escala global y también se utiliza para apoyar la toma de decisiones de las agencias meteorológicas

Un nuevo enfoque de modelado con IA

WeatherNext 2 adopta un nuevo método de modelado de IA llamado Functional Generative Network (FGN)
- Inyecta directamente “ruido” en la estructura del modelo para que los resultados de predicción mantengan un estado físicamente realista e interconectado
Este enfoque es útil tanto para predicciones “marginales” como “conjuntas”
- Las marginales cubren elementos individuales, como la temperatura en una ubicación específica, la velocidad del viento por altitud o la humedad
- Las conjuntas se refieren a sistemas meteorológicos de gran escala formados por múltiples elementos combinados, y son esenciales para analizar fenómenos complejos como zonas de calor extremo o la predicción de generación eólica
El modelo se entrena solo con datos marginales, pero aprende por sí mismo patrones conjuntos para realizar predicciones complejas

Acceso y uso de los datos

Los datos de predicción de WeatherNext 2 están disponibles públicamente en Google Earth Engine y BigQuery
- Se pueden consultar a través del catálogo de datos de Earth Engine y BigQuery Analytics Hub
En Google Cloud Vertex AI, se ofrecen capacidades de inferencia personalizada a través de un programa de acceso anticipado
Esta tecnología está integrada en Search, Gemini, Pixel Weather y la Weather API de Google Maps Platform, y en el futuro también se aplicará a la función de información meteorológica de Google Maps

De la investigación a la práctica

WeatherNext 2 es un ejemplo de cómo los resultados de investigación se amplían hacia aplicaciones reales
- Google abre herramientas y datos para que investigadores, desarrolladores y empresas de todo el mundo puedan utilizarlos para resolver problemas complejos
En el futuro, planea seguir mejorando el rendimiento del modelo mediante la integración de nuevas fuentes de datos y una mayor accesibilidad
Google también lo conecta con Earth Engine, AlphaEarth Foundations y Earth AI para fortalecer el ecosistema de investigación de IA geoespacial

Material adicional

Publicación del paper relacionado con WeatherNext 2 (arXiv: 2506.10772)
Se ofrecen documentación para desarrolladores, catálogo de datos de Earth Engine, ejemplos de consultas en BigQuery y página de registro para acceso anticipado de Vertex AI
Entre los modelos relacionados también se presentan GenCast (predicción de clima extremo) y GraphCast (pronóstico global rápido)

1 comentarios

GN⁺ 2025-11-19

Comentarios en Hacker News

Estoy bastante metido en este tema, y algo que podría resultarle interesante a alguien de afuera es que todos los modelos recientes como neuralgcm o WeatherNext 1 se entrenan con una función objetivo llamada CRPS
Casi no se usa este enfoque en el ML general; solo lo he visto en predicción meteorológica
En resumen, se agrega ruido aleatorio a la entrada y se entrena para minimizar una pérdida normal (L1, etc.) mientras al mismo tiempo se maximiza la diferencia entre dos resultados generados con distintas inicializaciones de ruido
Me pregunto si algún día este enfoque también se aplicará al GenAI tradicional
- Me pregunto si el ruido no se agrega a los parámetros del modelo en vez de a la entrada
  Esto me recuerda al paper de Variational Noise
  Si de verdad se le agrega ruido a la entrada, entonces parecería algo similar a técnicas de SSL como DINO
- Hace poco, en un trabajo de optimización, quería producir intencionalmente dos salidas distintas y no pude encontrar una buena heurística
  No tenía nada que ver con GenAI, pero siento que este método CRPS me habría ayudado
- Este enfoque me recuerda a un Variational Autoencoder
- Me gustaría entender cuál es el objetivo de usar esto en lugar de una pérdida L2
- Hay que dejar claro que, aunque el modelo aprende de datos históricos, en la predicción real se ejecuta un ensemble varias veces con nuevas observaciones
Últimamente he sentido que el pronóstico local del tiempo en Google Search se ha vuelto notablemente impreciso
Desde hace unas semanas seguía pronosticando que la temperatura nocturna iba a bajar de cero, pero en la práctica no pasó
Mi zona sí es difícil de predecir, pero otras fuentes que no son de Google fueron mucho más precisas
Me pregunto si el rollout del nuevo modelo ya ocurrió y por eso empeoró, o si al contrario está por mejorar
También quisiera saber si existe algún sitio donde se pueda comparar el rendimiento de pronóstico por modelo a nivel local
- La API gratuita de Open-Meteo es útil
  Permite visualizar en gráficos los datos de pronóstico por modelo e incluye varios modelos principales
  Pero WeatherNext todavía no está
- Comparar el rendimiento de los modelos por región parece una función tan obvia, pero en realidad casi no existe. Me pregunto por qué
En el anuncio se enfatizaron las mejoras en velocidad y cantidad de escenarios, pero sentí que faltó explicar la mejora en precisión
La frase “WeatherNext 2 es 8 veces más rápido y ofrece resolución horaria” suena muy bien, pero al final, como usuario, yo solo quiero un pronóstico preciso
- Lo importante es que el usuario final de este producto no es la gente común
  Métricas como la puntuación CRPS son para especialistas, y esto apunta a resolver el problema de under-dispersion de los modelos ensemble tradicionales
  Estas mejoras terminan sirviendo de base para elevar la precisión del pronóstico determinista que ve el usuario común
  La tecnología relacionada puede verse en WeatherBench
- Desde la perspectiva del usuario común, faltó explicación
  El núcleo del pronóstico del tiempo ha sido desde hace décadas el concepto de escenarios de ensemble, y “70% de probabilidad de lluvia” significa que en 70 de 100 escenarios llueve
  Es decir, no existe un único “pronóstico correcto”
- Como usuario, también quisiera ver la dispersión de la incertidumbre
  Muchas apps del tiempo lo muestran bien de forma visual
- El benchmark más importante es la precisión, y habría que compararlo con los modelos físicos existentes (GFS, ECMWF, etc.)
  Estos modelos corren en enormes clústeres HPC, pero como se calculan de forma centralizada y solo se distribuyen los resultados, siguen siendo eficientes
- Es un modelo entrenado con datos históricos, pero parece faltarle componente físico
  Me pregunto dónde está la base física necesaria para lograr alto rendimiento
El motor de pronóstico del tiempo de Google ya es muy bueno, y la predicción de trayectorias de huracanes de esta temporada fue sorprendentemente precisa
En cambio, el Global Forecasting System (GFS) del gobierno de EE. UU. parece ir cada vez peor
Artículo relacionado: enlace de Ars Technica
- Me pregunto qué significa exactamente eso de que “GFS está empeorando”
Al leer el paper, no vi que se especificara con qué frecuencia hay que reentrenar el modelo
Si la arquitectura aprende distribuciones por región, entonces con el tiempo los patrones cambian y parecería necesario reentrenarlo periódicamente
Si hubiera que entrenarlo 3 días cada semana, eso en la práctica podría ser un problema de costos
Me recordó una anécdota de la Segunda Guerra Mundial
Se dice que Kenneth Arrow descubrió que los pronósticos de largo plazo no eran mejores que una suposición aleatoria, pero su superior respondió que “aunque sepamos que no sirven, igual los necesitamos para planificar”
- Lo escuché en una clase de estadística, pero en realidad hay muchos más días de buen tiempo que de mal tiempo
  Así que si uno solo dice “no va a llover”, acierta el 90% de las veces
  Lo irónico es que los pronósticos del pasado tenían menos precisión que eso
  Los modelos de hoy son realmente impresionantes; hasta el pronóstico de 10 días suele acertar
- También existe la interpretación de que la adivinación en la antigüedad no era simple superstición, sino una herramienta de toma de decisiones para obligar a actuar mediante una elección aleatoria cuando no se podía decidir
- Como en la frase de Eisenhower, “los planes son inútiles, pero el proceso de planificar es indispensable”
Últimamente la precisión de la app del tiempo predeterminada de Google ha bajado
Muchas veces hay diferencias de unos 2 a 5 grados
Probé la app Weawow, que me recomendaron en HN; el nombre no me encanta, pero la precisión es excelente
Hasta ahora es la que más me ha satisfecho
Los pronósticos del tiempo basados en IA todavía se sienten lejanos en la vida real
Incluso comparado con la época en que la generación de mis padres veía el pronóstico en la TV, la precisión percibida no parece tan distinta
Sigue pasando que en un día pronosticado como soleado cae un aguacero, o que se pronostica lluvia y al final está despejado todo el día
Desde la perspectiva del consumidor, da la impresión de que el avance tecnológico no se traduce en una confianza percibida real
- Los datos existen: según Our World in Data, la precisión del pronóstico ha mejorado de forma constante
- El problema es la forma de presentar los datos
  Por ejemplo, en Apple Weather un “día lluvioso” se muestra así si en algún momento del día hay alta probabilidad de lluvia
  En realidad podría llover solo a las 5 a. m. y luego estar despejado el resto del tiempo
  El usuario tiene que poder interpretar los datos, y sería bueno que la IA pudiera contextualizar el pronóstico según los intereses de cada persona
- Los pronósticos siguen mejorando, pero es una evolución gradual, no una revolución repentina
  Por ejemplo, a Weathergraph le agregaron la predicción de lluvia a corto plazo de rainbow.ai, y ha sido de lo más preciso que he usado
  Los datos de radar en sí también tienen mucho ruido, y el proceso de depurarlos ya es en sí un modelo de ML
- En la práctica, la precisión sí ha mejorado muchísimo
  El nivel de un pronóstico de 1 día de hace 30 años equivale a la precisión de un pronóstico de 4 días actual
  Pero no es que entendamos mejor el clima, sino que es resultado del enorme aumento en capacidad de cómputo
- El pronóstico del tiempo común y corriente sigue sin ser perfecto
Me preguntaba dónde se puede usar este modelo
Estoy buscando pronósticos hiperlocales, como los de antes de Dark Sky
- Ahora los resultados de investigación ya se integraron a servicios reales
  Los datos de pronóstico de WeatherNext 2 están disponibles en Earth Engine y BigQuery, y también hay un programa de acceso anticipado en Vertex AI para inferencia personalizada
  Además, ya se aplica en Search, Gemini, Pixel Weather, Google Maps Platform Weather API
- En lo personal, la app que más me gusta es Windy
  Puedes comparar diferencias de pronóstico entre modelos, y la animación de vectores de viento es visualmente muy interesante
- El modelo HRRR también es muy bueno
  Se actualiza cada hora y ofrece pronósticos con resolución de 15 minutos hasta 18 horas, y de 1 hora hasta 48 horas
  Sitio de HRRR
- Antes Weather Underground integraba datos de estaciones meteorológicas personales
  Ha cambiado mucho desde que la compró IBM, pero tal vez ese proyecto siga vivo
- También vale la pena revisar el enlace oficial de Weather API de Google
Me pregunto si el modelo que dio la predicción de huracanes más precisa esta temporada es el mismo que se presentó ahora
Artículo relacionado: enlace de Ars Technica

WeatherNext 2: el modelo de predicción meteorológica más avanzado de Google DeepMind

Resumen de WeatherNext 2

Un nuevo enfoque de modelado con IA

Acceso y uso de los datos

De la investigación a la práctica

Material adicional

Lecturas relacionadas

1 comentarios

Comentarios en Hacker News