13 puntos por xguru 2023-04-03 | Aún no hay comentarios. | Compartir por WhatsApp
  • Modelo de lenguaje de 50 mil millones (50B) de parámetros, entrenado con una amplia variedad de datos financieros
  • Se construyó un dataset de 363 mil millones de tokens basado en las fuentes de datos de Bloomberg, reforzado con 345 mil millones de tokens de datasets generales
  • No presenta degradación de rendimiento en benchmarks generales de LLM y, en tareas financieras, muestra un desempeño muy superior al de modelos existentes
  • También describe las decisiones de modelado, el proceso de entrenamiento y la metodología de evaluación
  • Como siguiente paso, planean publicar un registro de entrenamiento (crónica) que cubra en detalle la experiencia de entrenamiento de BloombergGPT

Aún no hay comentarios.

Aún no hay comentarios.