Ollama ahora admite tarjetas gráficas AMD

(ollama.com)

3 puntos por GN⁺ 2024-03-16 | 1 comentarios | Compartir por WhatsApp

Ollama comenzó a admitir tarjetas gráficas AMD en una versión preliminar para Windows y Linux
Todas las funciones de Ollama ahora pueden acelerarse con tarjetas gráficas AMD en Linux y Windows

Tarjetas gráficas compatibles

Serie AMD Radeon RX: 7900 XTX, 7900 XT, 7900, 7800 XT, 7700 XT, 7600 XT, 7600, 6950 XT, 6900 XTX, 6900XT, 6800 XT, 6800, Vega 64, Vega 56
Serie AMD Radeon PRO: W7900, W7800, W7700, W7600, W7500, W6900X, W6800X Duo, W6800X, W6800, V620, V420, V340, V320, Vega II Duo, Vega II, VII SSG
Serie AMD Instinct: MI300X, MI300A, MI300, MI250X, MI250, MI210, MI200, MI100, MI60, MI50
Próximamente se añadirá soporte para más tarjetas gráficas AMD.

1 comentarios

GN⁺ 2024-03-16

Opiniones de Hacker News

Falta de reconocimiento a las contribuciones de llama.cpp
- Se nota que llama.cpp no recibe reconocimiento directo ni agradecimientos por las herramientas que se basan en la tecnología que proporciona.
- Otro software de "ejecución local" recibe un nivel adecuado de crédito; Ollama parece no tener problemas con la licencia MIT, pero no hay muestras de agradecimiento ni en el repositorio, ni en el blog, ni en el sitio web de Ollama.
Opiniones sobre la publicación del blog relacionada con el soporte de AMD en Ollama
- La publicación del blog resulta curiosa. Ya estaba ejecutando Ollama en una AMD RX 6650 desde hace varias semanas.
- Ofrecían un contenedor ROCm desde hace 21 días, y parece que se publicó junto con la última versión, la 0.1.29. Me pregunto qué cambió realmente en esta versión con respecto al soporte de AMD.
- Hay un issue que describe el proceso para ejecutar Ollama en tarjetas AMD no soportadas oficialmente. Básicamente, solo hay que configurar variables de entorno.
- Descubrí el cambio de que el modelo starcoder2 ahora funciona. Antes se cerraba inesperadamente.
Dudas sobre la atención excesiva que recibe Ollama
- No tengo claro por qué Ollama recibe tanta atención. Tiene un valor limitado, ya que solo soporta un modelo a la vez y se usa únicamente para experimentación.
- Hace que el proceso de experimentar sea muy fácil, pero considerando que depende por completo de llama.cpp y que su principal propuesta de valor es la gestión sencilla de modelos, creo que su valor está sobreestimado frente a la atención y los elogios que recibe.
- Después de la experimentación inicial, al final hay que desplegar los modelos en un entorno de producción. No se trata de darle crédito a llama.cpp, sino de señalar que este producto está recibiendo más atención de la que aporta en valor.
Agradecimiento por el soporte para RX 6800/6800 XT / 6900 XT
- Me alegra poder usar para trabajo de ML una tarjeta que compré pagando de más por la escasez posterior al covid.
- Gracias al proyecto Ollama y a llama.cpp.
Mensaje de advertencia relacionado con AMD al ejecutar Ollama
- fooocus funciona, pero al ejecutar Ollama aparece un mensaje de advertencia relacionado con el driver de AMD en Linux.
- Como no están las librerías de ROCm, termina usando la CPU.
- Tendré que revisar cómo reinstalar ROCm en Arch Linux.
Reacción positiva ante la pérdida de competitividad de CUDA
- Mientras más proyectos como este aparezcan, menos importante será CUDA y menor será la ventaja competitiva de Nvidia.
El software local para LLM impulsa la compra de hardware nuevo
- Tarjetas antiguas como la RX 570/580 no reciben soporte y, aunque el hardware nuevo es mucho más potente, pensaba que no haría falta una tarjeta reciente, ya que CUDA salió en 2007 y ROCm en 2016.
La experiencia sencilla de uso de Ollama
- No tenía experiencia ejecutando modelos locales, pero en Ubuntu 22 funcionó de inmediato con una tarjeta 7600, así que está excelente.
Curiosidad sobre el uso de OpenCL
- OpenCL se usa poco en comparación con Cuda, así que me pregunto cómo lograron implementarlo con éxito.
- Pagué una cantidad considerable por una tarjeta 4090, pero ojalá hubiera más opciones.
Precio de las tarjetas NVidia y esfuerzos por mejorar el soporte de AMD
- Da a entender que se está haciendo mucho esfuerzo por mejorar el soporte de AMD en un contexto donde las tarjetas NVidia de gama alta son muy caras y difíciles de conseguir.

Ollama ahora admite tarjetas gráficas AMD

Tarjetas gráficas compatibles

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News