Guía para ejecutar Llama 2 localmente
(replicate.com)- Puedes ejecutar Llama 2 en tu propio dispositivo sin conexión a Internet.
- Hay tres herramientas de código abierto para ejecutar Llama 2 localmente: Llama.cpp, Ollama y MLC LLM.
- Llama.cpp es un port de Llama en C/C++ compatible con Mac, Windows y Linux.
- Ollama es una app para macOS que permite ejecutar Llama 2 desde la interfaz de línea de comandos.
- MLC LLM permite ejecutar Llama 2 en teléfonos, incluidos iOS y Android.
- Ollama recomienda al menos 8 GB de RAM para ejecutar el modelo 3B, 16 GB para el modelo 7B y 32 GB para el modelo 13B.
- MLC LLM es compatible con las versiones 7B, 13B y 70B de Llama 2, aunque todavía está en beta para usuarios de iPhone.
- Puedes compartir tus creaciones y recibir soporte en la comunidad de Discord.
- Replicate ofrece opciones para ejecutar Llama 2 en la nube y hacer fine-tuning.
2 comentarios
Funciona bien ejecutándolo en una Mac Studio M2.
Comentarios en Hacker News
The Matrix.