Ollama 0.4, compatibilidad con Llama 3.2 Vision
(ollama.com)- Llama 3.2 Vision es un modelo generativo de inferencia de imágenes de tamaño 11B/90B
- Optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de subtítulos y respuestas a preguntas generales sobre imágenes
- Se puede ejecutar con
ollama run llama3.2-vision:90by luego agregar una imagen al prompt para hacer preguntas - Ejemplos de uso: reconocimiento de escritura a mano, OCR, interpretación de gráficos/tablas, Q/A sobre imágenes
Aún no hay comentarios.