MiniLLM - Ejecutar LLM en una GPU personal

xguru · 2023-03-30T10:45:01+09:00

Un sistema minimalista para ejecutar los LLM más recientes en GPU Nvidia de consumo Soporta múltiples LLM (LLAMA, BLOOM, OPT) de hasta 170B de tamaño Compatible con varios tipos de GPU Nvidia Código pequeño y fácil de usar hecho en Python Internamente usa el algoritmo GPTQ para compresión de 3 bits, minimizando el uso de memoria GPU

(github.com/kuleshov)

22 puntos por xguru 2023-03-30 | Aún no hay comentarios. | Compartir por WhatsApp

Un sistema minimalista para ejecutar los LLM más recientes en GPU Nvidia de consumo
Soporta múltiples LLM (LLAMA, BLOOM, OPT) de hasta 170B de tamaño
Compatible con varios tipos de GPU Nvidia
Código pequeño y fácil de usar hecho en Python
Internamente usa el algoritmo GPTQ para compresión de 3 bits, minimizando el uso de memoria GPU

MiniLLM - Ejecutar LLM en una GPU personal

Lecturas relacionadas

Aún no hay comentarios.