5 puntos por GN⁺ 2025-11-19 | 1 comentarios | Compartir por WhatsApp
  • WeatherNext 2 es un modelo basado en IA que mejora significativamente la precisión y la eficiencia de la predicción meteorológica global
  • Genera cientos de escenarios meteorológicos en menos de un minuto en una sola TPU, y ofrece una velocidad de predicción 8 veces mayor que los modelos existentes
  • Mediante una nueva arquitectura de Functional Generative Network (FGN), mantiene predicciones físicamente consistentes y admite resolución horaria
  • Los datos de predicción están disponibles en Earth Engine y BigQuery, y ofrece capacidades de inferencia personalizada a través del programa de acceso anticipado de Vertex AI
  • Esta tecnología mejora las funciones meteorológicas en los servicios de Google, incluidos Search, Gemini, Pixel Weather y Google Maps Platform

Resumen de WeatherNext 2

  • Google DeepMind y Google Research desarrollaron conjuntamente WeatherNext 2, un modelo de predicción meteorológica basado en IA que ofrece una velocidad 8 veces mayor y resolución por hora frente a generaciones anteriores
    • Genera cientos de escenarios meteorológicos posibles a partir de una sola entrada
    • La predicción se completa en menos de un minuto en una sola TPU, mientras que los modelos físicos basados en supercomputadoras existentes requieren horas
  • Este modelo muestra un rendimiento superior al de versiones anteriores en 99.9% de las variables y horizontes de pronóstico (de 0 a 15 días), incluidos temperatura, velocidad del viento y humedad
  • WeatherNext 2 hace posible la predicción de alta resolución a escala global y también se utiliza para apoyar la toma de decisiones de las agencias meteorológicas

Un nuevo enfoque de modelado con IA

  • WeatherNext 2 adopta un nuevo método de modelado de IA llamado Functional Generative Network (FGN)
    • Inyecta directamente “ruido” en la estructura del modelo para que los resultados de predicción mantengan un estado físicamente realista e interconectado
  • Este enfoque es útil tanto para predicciones “marginales” como “conjuntas”
    • Las marginales cubren elementos individuales, como la temperatura en una ubicación específica, la velocidad del viento por altitud o la humedad
    • Las conjuntas se refieren a sistemas meteorológicos de gran escala formados por múltiples elementos combinados, y son esenciales para analizar fenómenos complejos como zonas de calor extremo o la predicción de generación eólica
  • El modelo se entrena solo con datos marginales, pero aprende por sí mismo patrones conjuntos para realizar predicciones complejas

Acceso y uso de los datos

  • Los datos de predicción de WeatherNext 2 están disponibles públicamente en Google Earth Engine y BigQuery
    • Se pueden consultar a través del catálogo de datos de Earth Engine y BigQuery Analytics Hub
  • En Google Cloud Vertex AI, se ofrecen capacidades de inferencia personalizada a través de un programa de acceso anticipado
  • Esta tecnología está integrada en Search, Gemini, Pixel Weather y la Weather API de Google Maps Platform, y en el futuro también se aplicará a la función de información meteorológica de Google Maps

De la investigación a la práctica

  • WeatherNext 2 es un ejemplo de cómo los resultados de investigación se amplían hacia aplicaciones reales
    • Google abre herramientas y datos para que investigadores, desarrolladores y empresas de todo el mundo puedan utilizarlos para resolver problemas complejos
  • En el futuro, planea seguir mejorando el rendimiento del modelo mediante la integración de nuevas fuentes de datos y una mayor accesibilidad
  • Google también lo conecta con Earth Engine, AlphaEarth Foundations y Earth AI para fortalecer el ecosistema de investigación de IA geoespacial

Material adicional

  • Publicación del paper relacionado con WeatherNext 2 (arXiv: 2506.10772)
  • Se ofrecen documentación para desarrolladores, catálogo de datos de Earth Engine, ejemplos de consultas en BigQuery y página de registro para acceso anticipado de Vertex AI
  • Entre los modelos relacionados también se presentan GenCast (predicción de clima extremo) y GraphCast (pronóstico global rápido)

1 comentarios

 
GN⁺ 2025-11-19
Comentarios en Hacker News
  • Estoy bastante metido en este tema, y algo que podría resultarle interesante a alguien de afuera es que todos los modelos recientes como neuralgcm o WeatherNext 1 se entrenan con una función objetivo llamada CRPS
    Casi no se usa este enfoque en el ML general; solo lo he visto en predicción meteorológica
    En resumen, se agrega ruido aleatorio a la entrada y se entrena para minimizar una pérdida normal (L1, etc.) mientras al mismo tiempo se maximiza la diferencia entre dos resultados generados con distintas inicializaciones de ruido
    Me pregunto si algún día este enfoque también se aplicará al GenAI tradicional

    • Me pregunto si el ruido no se agrega a los parámetros del modelo en vez de a la entrada
      Esto me recuerda al paper de Variational Noise
      Si de verdad se le agrega ruido a la entrada, entonces parecería algo similar a técnicas de SSL como DINO
    • Hace poco, en un trabajo de optimización, quería producir intencionalmente dos salidas distintas y no pude encontrar una buena heurística
      No tenía nada que ver con GenAI, pero siento que este método CRPS me habría ayudado
    • Este enfoque me recuerda a un Variational Autoencoder
    • Me gustaría entender cuál es el objetivo de usar esto en lugar de una pérdida L2
    • Hay que dejar claro que, aunque el modelo aprende de datos históricos, en la predicción real se ejecuta un ensemble varias veces con nuevas observaciones
  • Últimamente he sentido que el pronóstico local del tiempo en Google Search se ha vuelto notablemente impreciso
    Desde hace unas semanas seguía pronosticando que la temperatura nocturna iba a bajar de cero, pero en la práctica no pasó
    Mi zona sí es difícil de predecir, pero otras fuentes que no son de Google fueron mucho más precisas
    Me pregunto si el rollout del nuevo modelo ya ocurrió y por eso empeoró, o si al contrario está por mejorar
    También quisiera saber si existe algún sitio donde se pueda comparar el rendimiento de pronóstico por modelo a nivel local

    • La API gratuita de Open-Meteo es útil
      Permite visualizar en gráficos los datos de pronóstico por modelo e incluye varios modelos principales
      Pero WeatherNext todavía no está
    • Comparar el rendimiento de los modelos por región parece una función tan obvia, pero en realidad casi no existe. Me pregunto por qué
  • En el anuncio se enfatizaron las mejoras en velocidad y cantidad de escenarios, pero sentí que faltó explicar la mejora en precisión
    La frase “WeatherNext 2 es 8 veces más rápido y ofrece resolución horaria” suena muy bien, pero al final, como usuario, yo solo quiero un pronóstico preciso

    • Lo importante es que el usuario final de este producto no es la gente común
      Métricas como la puntuación CRPS son para especialistas, y esto apunta a resolver el problema de under-dispersion de los modelos ensemble tradicionales
      Estas mejoras terminan sirviendo de base para elevar la precisión del pronóstico determinista que ve el usuario común
      La tecnología relacionada puede verse en WeatherBench
    • Desde la perspectiva del usuario común, faltó explicación
      El núcleo del pronóstico del tiempo ha sido desde hace décadas el concepto de escenarios de ensemble, y “70% de probabilidad de lluvia” significa que en 70 de 100 escenarios llueve
      Es decir, no existe un único “pronóstico correcto”
    • Como usuario, también quisiera ver la dispersión de la incertidumbre
      Muchas apps del tiempo lo muestran bien de forma visual
    • El benchmark más importante es la precisión, y habría que compararlo con los modelos físicos existentes (GFS, ECMWF, etc.)
      Estos modelos corren en enormes clústeres HPC, pero como se calculan de forma centralizada y solo se distribuyen los resultados, siguen siendo eficientes
    • Es un modelo entrenado con datos históricos, pero parece faltarle componente físico
      Me pregunto dónde está la base física necesaria para lograr alto rendimiento
  • El motor de pronóstico del tiempo de Google ya es muy bueno, y la predicción de trayectorias de huracanes de esta temporada fue sorprendentemente precisa
    En cambio, el Global Forecasting System (GFS) del gobierno de EE. UU. parece ir cada vez peor
    Artículo relacionado: enlace de Ars Technica

    • Me pregunto qué significa exactamente eso de que “GFS está empeorando”
  • Al leer el paper, no vi que se especificara con qué frecuencia hay que reentrenar el modelo
    Si la arquitectura aprende distribuciones por región, entonces con el tiempo los patrones cambian y parecería necesario reentrenarlo periódicamente
    Si hubiera que entrenarlo 3 días cada semana, eso en la práctica podría ser un problema de costos

  • Me recordó una anécdota de la Segunda Guerra Mundial
    Se dice que Kenneth Arrow descubrió que los pronósticos de largo plazo no eran mejores que una suposición aleatoria, pero su superior respondió que “aunque sepamos que no sirven, igual los necesitamos para planificar”

    • Lo escuché en una clase de estadística, pero en realidad hay muchos más días de buen tiempo que de mal tiempo
      Así que si uno solo dice “no va a llover”, acierta el 90% de las veces
      Lo irónico es que los pronósticos del pasado tenían menos precisión que eso
      Los modelos de hoy son realmente impresionantes; hasta el pronóstico de 10 días suele acertar
    • También existe la interpretación de que la adivinación en la antigüedad no era simple superstición, sino una herramienta de toma de decisiones para obligar a actuar mediante una elección aleatoria cuando no se podía decidir
    • Como en la frase de Eisenhower, “los planes son inútiles, pero el proceso de planificar es indispensable”
  • Últimamente la precisión de la app del tiempo predeterminada de Google ha bajado
    Muchas veces hay diferencias de unos 2 a 5 grados
    Probé la app Weawow, que me recomendaron en HN; el nombre no me encanta, pero la precisión es excelente
    Hasta ahora es la que más me ha satisfecho

  • Los pronósticos del tiempo basados en IA todavía se sienten lejanos en la vida real
    Incluso comparado con la época en que la generación de mis padres veía el pronóstico en la TV, la precisión percibida no parece tan distinta
    Sigue pasando que en un día pronosticado como soleado cae un aguacero, o que se pronostica lluvia y al final está despejado todo el día
    Desde la perspectiva del consumidor, da la impresión de que el avance tecnológico no se traduce en una confianza percibida real

    • Los datos existen: según Our World in Data, la precisión del pronóstico ha mejorado de forma constante
    • El problema es la forma de presentar los datos
      Por ejemplo, en Apple Weather un “día lluvioso” se muestra así si en algún momento del día hay alta probabilidad de lluvia
      En realidad podría llover solo a las 5 a. m. y luego estar despejado el resto del tiempo
      El usuario tiene que poder interpretar los datos, y sería bueno que la IA pudiera contextualizar el pronóstico según los intereses de cada persona
    • Los pronósticos siguen mejorando, pero es una evolución gradual, no una revolución repentina
      Por ejemplo, a Weathergraph le agregaron la predicción de lluvia a corto plazo de rainbow.ai, y ha sido de lo más preciso que he usado
      Los datos de radar en sí también tienen mucho ruido, y el proceso de depurarlos ya es en sí un modelo de ML
    • En la práctica, la precisión sí ha mejorado muchísimo
      El nivel de un pronóstico de 1 día de hace 30 años equivale a la precisión de un pronóstico de 4 días actual
      Pero no es que entendamos mejor el clima, sino que es resultado del enorme aumento en capacidad de cómputo
    • El pronóstico del tiempo común y corriente sigue sin ser perfecto
  • Me preguntaba dónde se puede usar este modelo
    Estoy buscando pronósticos hiperlocales, como los de antes de Dark Sky

    • Ahora los resultados de investigación ya se integraron a servicios reales
      Los datos de pronóstico de WeatherNext 2 están disponibles en Earth Engine y BigQuery, y también hay un programa de acceso anticipado en Vertex AI para inferencia personalizada
      Además, ya se aplica en Search, Gemini, Pixel Weather, Google Maps Platform Weather API
    • En lo personal, la app que más me gusta es Windy
      Puedes comparar diferencias de pronóstico entre modelos, y la animación de vectores de viento es visualmente muy interesante
    • El modelo HRRR también es muy bueno
      Se actualiza cada hora y ofrece pronósticos con resolución de 15 minutos hasta 18 horas, y de 1 hora hasta 48 horas
      Sitio de HRRR
    • Antes Weather Underground integraba datos de estaciones meteorológicas personales
      Ha cambiado mucho desde que la compró IBM, pero tal vez ese proyecto siga vivo
    • También vale la pena revisar el enlace oficial de Weather API de Google
  • Me pregunto si el modelo que dio la predicción de huracanes más precisa esta temporada es el mismo que se presentó ahora
    Artículo relacionado: enlace de Ars Technica