Meta AI publica el dataset PUG (Photorealistic Unreal Graphics) para modelos de visión
(pug.metademolab.com)Meta AI publicó el dataset PUG para modelos de visión
- Tres tipos de datasets: PUG: Animals, PUG: ImageNet y PUG: SPAR
- PUG: Animals: un dataset que no solo permite investigar mejor las representaciones de los modelos de visión, sino que también sirve para investigación OOD
- PUG: ImageNet: un dataset para modelos preentrenados con ImageNet que permite entender mejor las capacidades de los modelos de visión en términos de robustez frente a factores específicos de variación
- PUG: SPAR: un dataset para evaluar la capacidad de comprensión de los VLM usando datos sintéticos
- También se proporciona código de ejemplo para descargar y cargar el dataset
- Es posible configurar entornos y cargar datasets usando Unreal Engine
- Se distribuye bajo licencia CC-BY-NC
1 comentarios
Leer más