MPT-7B, un LLM de código abierto utilizable comercialmente
(mosaicml.com)- Transformer entrenado con 1 billón de tokens
- Calidad similar a LLaMA-7B, pero es de código abierto y se puede usar comercialmente
- Además, se publicaron 3 modelos ajustados adicionales
- MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (soporta 65K tokens)
- Fue entrenado en la plataforma MosaicML durante 9.5 días con un costo aproximado de ~$200K, y permite entrenar, ajustar y desplegar tu propio modelo MPT
- MPT: Mosaic Pretrained Transformers
2 comentarios
Viendo que últimamente están saliendo muchísimos modelos LLM de código abierto que pueden usarse comercialmente,
parece que están compitiendo por convertirse en el Stable Diffusion del mundo de los LLM.
Tengo muchas ganas de ver quién termina siendo el ganador. +_+
Primero conviene desarrollar integrándolo con ChatGPT y, más adelante, reemplazarlo por la opción de código abierto más avanzada.