DeepSpeed Chat: framework para entrenar modelos tipo ChatGPT con RLHF
(github.com/microsoft)- Framework de sistema abierto rápido, económico y escalable
- Permite crear modelos de alta calidad estilo ChatGPT de cualquier escala mediante RLHF (Reinforcement Learning Human Feedback) de extremo a extremo
- Con 1 clic, permite entrenar, generar y servir un modelo ChatGPT de 1.3B parámetros en 1.36 horas usando una sola GPU NVIDIA A6000 con 48 GB de memoria
- Ya es utilizado por Databricks Dolly, CarperAI-TRLX y Huggingface-PEFT
1 comentarios
DeepSpeed - la biblioteca de optimización de deep learning publicada por Microsoft
Databricks publica como open source Dolly 2.0, similar a ChatGPT