14 puntos por xguru 2023-05-09 | 2 comentarios | Compartir por WhatsApp
  • Transformer entrenado con 1 billón de tokens
  • Calidad similar a LLaMA-7B, pero es de código abierto y se puede usar comercialmente
  • Además, se publicaron 3 modelos ajustados adicionales
    • MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (soporta 65K tokens)
  • Fue entrenado en la plataforma MosaicML durante 9.5 días con un costo aproximado de ~$200K, y permite entrenar, ajustar y desplegar tu propio modelo MPT
  • MPT: Mosaic Pretrained Transformers

2 comentarios

 
kuroneko 2023-05-09

Viendo que últimamente están saliendo muchísimos modelos LLM de código abierto que pueden usarse comercialmente,
parece que están compitiendo por convertirse en el Stable Diffusion del mundo de los LLM.

Tengo muchas ganas de ver quién termina siendo el ganador. +_+

 
xguru 2023-05-09

Primero conviene desarrollar integrándolo con ChatGPT y, más adelante, reemplazarlo por la opción de código abierto más avanzada.