LLaMA-rs - LLaMA implementado en Rust
(github.com/setzer22)- Proyecto que porta
llama.cppa Rust - Compatible con modelos en versiones
f16o cuantizadas a 4 bits - Usa la biblioteca de tensores
ggmltal como el original, con un rendimiento equivalente al original
1 comentarios
También existe una implementación de Rust de LLaMA: RLLaMA - Rust+OpenCL+AVX2.
llama.cpp - Inferencia del modelo LLaMA de Facebook en C/C++ puro