OpenLLaMA - la réplica abierta de LLaMA

xguru · 2023-05-05T10:16:01+09:00

Una réplica de LLaMA creada con licencia Apache para permitir su uso en distintos fines Utiliza el dataset RedPajama publicado por Together Entrenado mediante EasyLM, un pipeline basado en JAX Se publica OpenLLaMA 7B basado en 200B/300B tokens

(github.com/openlm-research)

20 puntos por xguru 2023-05-05 | 1 comentarios | Compartir por WhatsApp

Una réplica de LLaMA creada con licencia Apache para permitir su uso en distintos fines
Utiliza el dataset RedPajama publicado por Together
Entrenado mediante EasyLM, un pipeline basado en JAX
Se publica OpenLLaMA 7B basado en 200B/300B tokens

1 comentarios

xguru 2023-05-05

Parece que en los comentarios de HN publicaron el comando para "usar OpenLLaMA en llama.cpp + 8 GB de RAM"
https://news.ycombinator.com/item?id=35798888

  git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && cmake -B build && cmake --build build  
  python3 -m pip install -r requirements.txt  
  
  cd models && git clone https://huggingface.co/openlm-research/open_llama_7b_preview_200bt/ && cd -  
  python3 convert-pth-to-ggml.py models/open_llama_7b_preview_200bt/open_llama_7b_preview_200bt_transformers_weights 1  
  ./build/bin/quantize models/open_llama_7b_preview_200bt/open_llama_7b_preview_200bt_transformers_weights/ggml-model-f16.bin models/open_llama_7b_preview_200bt_q5_0.ggml q5_0  
  ./build/bin/main -m models/open_llama_7b_preview_200bt_q5_0.ggml --ignore-eos -n 1280 -p "Building a website can be done in 10 simple steps:" --mlock

OpenLLaMA - la réplica abierta de LLaMA

Lecturas relacionadas

1 comentarios