- WeatherNext 2 es un modelo basado en IA que mejora significativamente la precisión y la eficiencia de la predicción meteorológica global
- Genera cientos de escenarios meteorológicos en menos de un minuto en una sola TPU, y ofrece una velocidad de predicción 8 veces mayor que los modelos existentes
- Mediante una nueva arquitectura de Functional Generative Network (FGN), mantiene predicciones físicamente consistentes y admite resolución horaria
- Los datos de predicción están disponibles en Earth Engine y BigQuery, y ofrece capacidades de inferencia personalizada a través del programa de acceso anticipado de Vertex AI
- Esta tecnología mejora las funciones meteorológicas en los servicios de Google, incluidos Search, Gemini, Pixel Weather y Google Maps Platform
Resumen de WeatherNext 2
- Google DeepMind y Google Research desarrollaron conjuntamente WeatherNext 2, un modelo de predicción meteorológica basado en IA que ofrece una velocidad 8 veces mayor y resolución por hora frente a generaciones anteriores
- Genera cientos de escenarios meteorológicos posibles a partir de una sola entrada
- La predicción se completa en menos de un minuto en una sola TPU, mientras que los modelos físicos basados en supercomputadoras existentes requieren horas
- Este modelo muestra un rendimiento superior al de versiones anteriores en 99.9% de las variables y horizontes de pronóstico (de 0 a 15 días), incluidos temperatura, velocidad del viento y humedad
- WeatherNext 2 hace posible la predicción de alta resolución a escala global y también se utiliza para apoyar la toma de decisiones de las agencias meteorológicas
Un nuevo enfoque de modelado con IA
- WeatherNext 2 adopta un nuevo método de modelado de IA llamado Functional Generative Network (FGN)
- Inyecta directamente “ruido” en la estructura del modelo para que los resultados de predicción mantengan un estado físicamente realista e interconectado
- Este enfoque es útil tanto para predicciones “marginales” como “conjuntas”
- Las marginales cubren elementos individuales, como la temperatura en una ubicación específica, la velocidad del viento por altitud o la humedad
- Las conjuntas se refieren a sistemas meteorológicos de gran escala formados por múltiples elementos combinados, y son esenciales para analizar fenómenos complejos como zonas de calor extremo o la predicción de generación eólica
- El modelo se entrena solo con datos marginales, pero aprende por sí mismo patrones conjuntos para realizar predicciones complejas
Acceso y uso de los datos
- Los datos de predicción de WeatherNext 2 están disponibles públicamente en Google Earth Engine y BigQuery
- Se pueden consultar a través del catálogo de datos de Earth Engine y BigQuery Analytics Hub
- En Google Cloud Vertex AI, se ofrecen capacidades de inferencia personalizada a través de un programa de acceso anticipado
- Esta tecnología está integrada en Search, Gemini, Pixel Weather y la Weather API de Google Maps Platform, y en el futuro también se aplicará a la función de información meteorológica de Google Maps
De la investigación a la práctica
- WeatherNext 2 es un ejemplo de cómo los resultados de investigación se amplían hacia aplicaciones reales
- Google abre herramientas y datos para que investigadores, desarrolladores y empresas de todo el mundo puedan utilizarlos para resolver problemas complejos
- En el futuro, planea seguir mejorando el rendimiento del modelo mediante la integración de nuevas fuentes de datos y una mayor accesibilidad
- Google también lo conecta con Earth Engine, AlphaEarth Foundations y Earth AI para fortalecer el ecosistema de investigación de IA geoespacial
Material adicional
- Publicación del paper relacionado con WeatherNext 2 (arXiv: 2506.10772)
- Se ofrecen documentación para desarrolladores, catálogo de datos de Earth Engine, ejemplos de consultas en BigQuery y página de registro para acceso anticipado de Vertex AI
- Entre los modelos relacionados también se presentan GenCast (predicción de clima extremo) y GraphCast (pronóstico global rápido)
1 comentarios
Comentarios en Hacker News
Estoy bastante metido en este tema, y algo que podría resultarle interesante a alguien de afuera es que todos los modelos recientes como neuralgcm o WeatherNext 1 se entrenan con una función objetivo llamada CRPS
Casi no se usa este enfoque en el ML general; solo lo he visto en predicción meteorológica
En resumen, se agrega ruido aleatorio a la entrada y se entrena para minimizar una pérdida normal (L1, etc.) mientras al mismo tiempo se maximiza la diferencia entre dos resultados generados con distintas inicializaciones de ruido
Me pregunto si algún día este enfoque también se aplicará al GenAI tradicional
Esto me recuerda al paper de Variational Noise
Si de verdad se le agrega ruido a la entrada, entonces parecería algo similar a técnicas de SSL como DINO
No tenía nada que ver con GenAI, pero siento que este método CRPS me habría ayudado
Últimamente he sentido que el pronóstico local del tiempo en Google Search se ha vuelto notablemente impreciso
Desde hace unas semanas seguía pronosticando que la temperatura nocturna iba a bajar de cero, pero en la práctica no pasó
Mi zona sí es difícil de predecir, pero otras fuentes que no son de Google fueron mucho más precisas
Me pregunto si el rollout del nuevo modelo ya ocurrió y por eso empeoró, o si al contrario está por mejorar
También quisiera saber si existe algún sitio donde se pueda comparar el rendimiento de pronóstico por modelo a nivel local
Permite visualizar en gráficos los datos de pronóstico por modelo e incluye varios modelos principales
Pero WeatherNext todavía no está
En el anuncio se enfatizaron las mejoras en velocidad y cantidad de escenarios, pero sentí que faltó explicar la mejora en precisión
La frase “WeatherNext 2 es 8 veces más rápido y ofrece resolución horaria” suena muy bien, pero al final, como usuario, yo solo quiero un pronóstico preciso
Métricas como la puntuación CRPS son para especialistas, y esto apunta a resolver el problema de under-dispersion de los modelos ensemble tradicionales
Estas mejoras terminan sirviendo de base para elevar la precisión del pronóstico determinista que ve el usuario común
La tecnología relacionada puede verse en WeatherBench
El núcleo del pronóstico del tiempo ha sido desde hace décadas el concepto de escenarios de ensemble, y “70% de probabilidad de lluvia” significa que en 70 de 100 escenarios llueve
Es decir, no existe un único “pronóstico correcto”
Muchas apps del tiempo lo muestran bien de forma visual
Estos modelos corren en enormes clústeres HPC, pero como se calculan de forma centralizada y solo se distribuyen los resultados, siguen siendo eficientes
Me pregunto dónde está la base física necesaria para lograr alto rendimiento
El motor de pronóstico del tiempo de Google ya es muy bueno, y la predicción de trayectorias de huracanes de esta temporada fue sorprendentemente precisa
En cambio, el Global Forecasting System (GFS) del gobierno de EE. UU. parece ir cada vez peor
Artículo relacionado: enlace de Ars Technica
Al leer el paper, no vi que se especificara con qué frecuencia hay que reentrenar el modelo
Si la arquitectura aprende distribuciones por región, entonces con el tiempo los patrones cambian y parecería necesario reentrenarlo periódicamente
Si hubiera que entrenarlo 3 días cada semana, eso en la práctica podría ser un problema de costos
Me recordó una anécdota de la Segunda Guerra Mundial
Se dice que Kenneth Arrow descubrió que los pronósticos de largo plazo no eran mejores que una suposición aleatoria, pero su superior respondió que “aunque sepamos que no sirven, igual los necesitamos para planificar”
Así que si uno solo dice “no va a llover”, acierta el 90% de las veces
Lo irónico es que los pronósticos del pasado tenían menos precisión que eso
Los modelos de hoy son realmente impresionantes; hasta el pronóstico de 10 días suele acertar
Últimamente la precisión de la app del tiempo predeterminada de Google ha bajado
Muchas veces hay diferencias de unos 2 a 5 grados
Probé la app Weawow, que me recomendaron en HN; el nombre no me encanta, pero la precisión es excelente
Hasta ahora es la que más me ha satisfecho
Los pronósticos del tiempo basados en IA todavía se sienten lejanos en la vida real
Incluso comparado con la época en que la generación de mis padres veía el pronóstico en la TV, la precisión percibida no parece tan distinta
Sigue pasando que en un día pronosticado como soleado cae un aguacero, o que se pronostica lluvia y al final está despejado todo el día
Desde la perspectiva del consumidor, da la impresión de que el avance tecnológico no se traduce en una confianza percibida real
Por ejemplo, en Apple Weather un “día lluvioso” se muestra así si en algún momento del día hay alta probabilidad de lluvia
En realidad podría llover solo a las 5 a. m. y luego estar despejado el resto del tiempo
El usuario tiene que poder interpretar los datos, y sería bueno que la IA pudiera contextualizar el pronóstico según los intereses de cada persona
Por ejemplo, a Weathergraph le agregaron la predicción de lluvia a corto plazo de rainbow.ai, y ha sido de lo más preciso que he usado
Los datos de radar en sí también tienen mucho ruido, y el proceso de depurarlos ya es en sí un modelo de ML
El nivel de un pronóstico de 1 día de hace 30 años equivale a la precisión de un pronóstico de 4 días actual
Pero no es que entendamos mejor el clima, sino que es resultado del enorme aumento en capacidad de cómputo
Me preguntaba dónde se puede usar este modelo
Estoy buscando pronósticos hiperlocales, como los de antes de Dark Sky
Los datos de pronóstico de WeatherNext 2 están disponibles en Earth Engine y BigQuery, y también hay un programa de acceso anticipado en Vertex AI para inferencia personalizada
Además, ya se aplica en Search, Gemini, Pixel Weather, Google Maps Platform Weather API
Puedes comparar diferencias de pronóstico entre modelos, y la animación de vectores de viento es visualmente muy interesante
Se actualiza cada hora y ofrece pronósticos con resolución de 15 minutos hasta 18 horas, y de 1 hora hasta 48 horas
Sitio de HRRR
Ha cambiado mucho desde que la compró IBM, pero tal vez ese proyecto siga vivo
Me pregunto si el modelo que dio la predicción de huracanes más precisa esta temporada es el mismo que se presentó ahora
Artículo relacionado: enlace de Ars Technica