7 puntos por ninebow 2023-08-13 | 1 comentarios | Compartir por WhatsApp

Meta AI publicó el dataset PUG para modelos de visión

  • Tres tipos de datasets: PUG: Animals, PUG: ImageNet y PUG: SPAR
    • PUG: Animals: un dataset que no solo permite investigar mejor las representaciones de los modelos de visión, sino que también sirve para investigación OOD
    • PUG: ImageNet: un dataset para modelos preentrenados con ImageNet que permite entender mejor las capacidades de los modelos de visión en términos de robustez frente a factores específicos de variación
    • PUG: SPAR: un dataset para evaluar la capacidad de comprensión de los VLM usando datos sintéticos
  • También se proporciona código de ejemplo para descargar y cargar el dataset
  • Es posible configurar entornos y cargar datasets usando Unreal Engine
  • Se distribuye bajo licencia CC-BY-NC