- LLaMA, lanzado recientemente por Meta, no está ajustado finamente para el proceso de entrenamiento RLHF
- ChatLLaMA es una implementación de RLHF con LLaMA y un proyecto completamente de código abierto para crear un servicio estilo ChatGPT
- Puede entrenarse aproximadamente 15 veces más rápido que ChatGPT
- Incluye soporte integrado para DeepSpeed ZERO para acelerar el proceso de ajuste fino
- Es compatible con 7B, 13B, 33B y 65B de LLaMA, por lo que se puede elegir el tamaño que mejor se adapte a cada necesidad
1 comentarios
LLaMA - implementación de código abierto de ChatGPT basada en LLaMA