ChatLLaMA - implementación de código abierto de ChatGPT basada en LLaMA

xguru · 2023-03-02T10:10:59+09:00

LLaMA, lanzado recientemente por Meta, no está ajustado finamente para el proceso de entrenamiento RLHF ChatLLaMA es una implementación de RLHF con LLaMA y un proyecto completamente de código abierto para crear un servicio estilo ChatGPT Puede entrenarse aproximadamente 15 veces más rápido que ChatGPT Incluye soporte integrado para DeepSpeed ZERO para acelerar el proceso de ajuste fino Es compatible con 7B, 13B, 33B y 65B de LLaMA, por lo que se puede elegir el tamaño que mejor se adapte a cada necesidad

(github.com/nebuly-ai)

15 puntos por xguru 2023-03-02 | 1 comentarios | Compartir por WhatsApp

LLaMA, lanzado recientemente por Meta, no está ajustado finamente para el proceso de entrenamiento RLHF
ChatLLaMA es una implementación de RLHF con LLaMA y un proyecto completamente de código abierto para crear un servicio estilo ChatGPT
Puede entrenarse aproximadamente 15 veces más rápido que ChatGPT
Incluye soporte integrado para DeepSpeed ZERO para acelerar el proceso de ajuste fino
Es compatible con 7B, 13B, 33B y 65B de LLaMA, por lo que se puede elegir el tamaño que mejor se adapte a cada necesidad

1 comentarios

xguru 2023-03-02

LLaMA - implementación de código abierto de ChatGPT basada en LLaMA

ChatLLaMA - implementación de código abierto de ChatGPT basada en LLaMA

Lecturas relacionadas

1 comentarios