Web LLM - Comienza el soporte para Llama2 7B/13B
(webllm.mlc.ai)- Servicio que ejecuta en el navegador, sin servidor, LLM como Llama, RedPajama y Vicuna mediante WASM
- Comienza el soporte para Llama 2 7B/13B
- También es compatible con Llama 2 70B, pero solo puede usarse en Macs con Apple Silicon + 64 GB de RAM o más
- Acelerado con WebGPU
7 comentarios
Porque es una 750Ti....
A menudo también se rompe en ChatGPT cuando la salida va como URL. Supongo que sí.
Me pareció increíble ver Stable Diffiusion corriendo en la web,
pero, ¿de verdad WebGPU podrá lograr una gran unificación de las APIs de GPU?
Es increíble.
Web LLM - Ejecutar LLM en el navegador acelerado con WebGPU