8 puntos por xguru 2024-11-08 | Aún no hay comentarios. | Compartir por WhatsApp
  • Llama 3.2 Vision es un modelo generativo de inferencia de imágenes de tamaño 11B/90B
    • Optimizado para reconocimiento visual, razonamiento sobre imágenes, generación de subtítulos y respuestas a preguntas generales sobre imágenes
  • Se puede ejecutar con ollama run llama3.2-vision:90b y luego agregar una imagen al prompt para hacer preguntas
  • Ejemplos de uso: reconocimiento de escritura a mano, OCR, interpretación de gráficos/tablas, Q/A sobre imágenes

Aún no hay comentarios.

Aún no hay comentarios.