LLaMA-CPU - Un fork para ejecutar LLaMA en CPU

xguru · 2023-03-09T11:20:01+09:00

Ejecuta el modelo LLaMA de Meta en CPU La configuración es casi igual Al probar con el modelo 7B, para cargarlo necesita swap/zram incluso con 32 GiB de RAM Durante la inferencia real, usa menos de unos 20 GiB de RAM En un Ryzen 7900X, el modelo 7B puede inferir algunas palabras por segundo

(github.com/markasoftware)

4 puntos por xguru 2023-03-09 | Aún no hay comentarios. | Compartir por WhatsApp

Ejecuta el modelo LLaMA de Meta en CPU
La configuración es casi igual
Al probar con el modelo 7B, para cargarlo necesita swap/zram incluso con 32 GiB de RAM
Durante la inferencia real, usa menos de unos 20 GiB de RAM
En un Ryzen 7900X, el modelo 7B puede inferir algunas palabras por segundo

LLaMA-CPU - Un fork para ejecutar LLaMA en CPU

Lecturas relacionadas

Aún no hay comentarios.