BloombergGPT - modelo de lenguaje a gran escala para finanzas

xguru · 2023-04-03T09:38:07+09:00

Modelo de lenguaje de 50 mil millones (50B) de parámetros, entrenado con una amplia variedad de datos financieros Se construyó un dataset de 363 mil millones de tokens basado en las fuentes de datos de Bloomberg, reforzado con 345 mil millones de tokens de datasets generales No presenta degradación de rendimiento en benchmarks generales de LLM y, en tareas financieras, muestra un desempeño muy superior al de modelos existentes También describe las decisiones de modelado, el proceso de entrenamiento y la metodología de evaluación Como siguiente paso, planean publicar un registro de entrenamiento (crónica) que cubra en detalle la experiencia de entrenamiento de BloombergGPT

(arxiv.org)

13 puntos por xguru 2023-04-03 | Aún no hay comentarios. | Compartir por WhatsApp

Modelo de lenguaje de 50 mil millones (50B) de parámetros, entrenado con una amplia variedad de datos financieros
Se construyó un dataset de 363 mil millones de tokens basado en las fuentes de datos de Bloomberg, reforzado con 345 mil millones de tokens de datasets generales
No presenta degradación de rendimiento en benchmarks generales de LLM y, en tareas financieras, muestra un desempeño muy superior al de modelos existentes
También describe las decisiones de modelado, el proceso de entrenamiento y la metodología de evaluación
Como siguiente paso, planean publicar un registro de entrenamiento (crónica) que cubra en detalle la experiencia de entrenamiento de BloombergGPT

BloombergGPT - modelo de lenguaje a gran escala para finanzas

Lecturas relacionadas

Aún no hay comentarios.