Ollama 0.4, compatibilidad con Llama 3.2 Vision

xguru · 2024-11-08T10:17:01+09:00

Llama 3.2 Vision es un modelo generativo de inferencia de imágenes de tamaño 11B/90B Optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de subtítulos y respuestas a preguntas generales sobre imágenes Se puede ejecutar con ollama run llama3.2-vision:90b y luego agregar una imagen al prompt para hacer preguntas Ejemplos de uso: reconocimiento de escritura a mano, OCR, interpretación de gráficos/tablas, Q/A sobre imágenes

(ollama.com)

8 puntos por xguru 2024-11-08 | Aún no hay comentarios. | Compartir por WhatsApp

Llama 3.2 Vision es un modelo generativo de inferencia de imágenes de tamaño 11B/90B
- Optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de subtítulos y respuestas a preguntas generales sobre imágenes
Se puede ejecutar con ollama run llama3.2-vision:90b y luego agregar una imagen al prompt para hacer preguntas
Ejemplos de uso: reconocimiento de escritura a mano, OCR, interpretación de gráficos/tablas, Q/A sobre imágenes

Ollama 0.4, compatibilidad con Llama 3.2 Vision

Lecturas relacionadas

Aún no hay comentarios.