ONE-PEACE: modelo de representación general para multimodalidad ilimitada
(github.com/OFA-Sys)- Modelo de representación general que abarca modalidades de visión, audio y lenguaje
- Logra excelentes resultados en tareas unificadas incluso sin modelos preentrenados
- Su potente recuperación zero-shot emergente permite alinear modalidades no emparejadas en los datos de entrenamiento
- Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image
1 comentarios
Veo que superó el SOTA en muchas tareas.