ImageBind - el modelo de IA multimodal de Meta
(imagebind.metademolab.com)- Incluso sin supervisión, vincula al mismo tiempo datos de 6 modalidades para analizar mejor distintos tipos de información
- imagen, video, audio, texto, profundidad, térmico (Thermal), IMU (unidad de medición inercial)
- permite generar imágenes a partir de sonido, o buscar información combinando datos de audio/video/imagen/profundidad
- Excelente rendimiento de reconocimiento Zero-shot / Few-Shot
Aún no hay comentarios.