- Un modelo fundacional para pronóstico de series temporales desarrollado por Google Research
- Preentrenado con 100 mil millones de puntos de datos de series temporales reales
- Muestra un rendimiento zero-shot sobresaliente en varios benchmarks públicos
- Puede aplicarse a datasets de distintos dominios y diferentes granularidades temporales
- El pronóstico de series temporales se utiliza ampliamente en diversos campos como retail, finanzas, manufactura, salud y ciencias naturales
- Por ejemplo, en retail, mejorar la precisión del pronóstico de demanda contribuye a reducir costos de inventario y aumentar ingresos
- Auge de los modelos de deep learning
- Los modelos de deep learning, que han demostrado un rendimiento sobresaliente en distintas configuraciones, se usan ampliamente para el pronóstico de series temporales
- En la competencia M5, los modelos de deep learning también obtuvieron buenos resultados
- Avances de los modelos de lenguaje a gran escala
- Los modelos de lenguaje a gran escala usados en tareas de procesamiento de lenguaje natural como traducción, generación aumentada con búsqueda y autocompletado de código han avanzado rápidamente
- Se entrenan con grandes volúmenes de datos de texto y tienen la capacidad de identificar patrones del lenguaje
- Al combinarse con búsqueda, pueden usarse como potentes herramientas zero-shot para responder preguntas sobre eventos actuales y resumir información
- Limitaciones de los modelos de pronóstico basados en deep learning
- Aunque muestran un mejor rendimiento que los métodos tradicionales, sigue siendo difícil reducir los costos de entrenamiento e inferencia
- Antes de probar el modelo con nuevos datos de series temporales, se requiere un largo ciclo de entrenamiento y validación
- TimesFM es un modelo fundacional decoder-only para pronóstico de series temporales
- Un único modelo de pronóstico preentrenado con 100 mil millones de datos reales de series temporales
- Tiene 2 millones de parámetros, mucho menos que los modelos de lenguaje a gran escala más recientes
- En datasets de distintos dominios y granularidades temporales, muestra en zero-shot un rendimiento cercano a enfoques supervisados de última generación
- Ofrece de inmediato pronósticos adecuados para datos de series temporales nunca antes vistos, sin entrenamiento adicional
- Permite que los usuarios se concentren en mejorar pronósticos para tareas downstream reales, como la planeación de demanda en retail
- Paper: "A decoder-only foundation model for time-series forecasting", previsto para presentarse en ICML 2024
Opinión de GN⁺
- Parece un nuevo modelo prometedor para pronóstico de series temporales, pero aún necesita validación en diversos casos de uso reales. En particular, que todavía no soporte pronóstico probabilístico deja algo que desear en términos de utilidad práctica
- Resulta interesante que el valor de frecuencia proporcionado como entrada pueda ajustarse arbitrariamente sin reflejar necesariamente la frecuencia real de los datos de series temporales, aunque parece que habrá que experimentar según cada dataset y caso de uso para encontrar el valor óptimo
- Como el primer checkpoint publicado está enfocado en series univariadas, también se espera una versión capaz de hacer pronóstico multivariado. Hará falta además comparar su rendimiento en datasets benchmark de pronóstico multivariado de series temporales
- Al introducir este modelo, será necesario contar con personal especializado capaz de seleccionar y ajustar el modelo según las propiedades de la serie temporal objetivo (longitud, distribución, estacionalidad, frecuencia, etc.) y el horizonte de pronóstico requerido. La disponibilidad de una API de inferencia end-to-end parece facilitar su uso, pero también deben considerarse las limitaciones de los modelos de caja negra
- Entre otras bibliotecas similares para pronóstico de series temporales están Kats de Meta, GluonTS, Darts y sktime. Conviene comparar las características, ventajas y desventajas de cada una y elegir el modelo más adecuado para los datos reales
Aún no hay comentarios.