ONE-PEACE: modelo general de representación para multimodalidad ilimitada
(github.com/OFA-Sys)- Modelo general de representación que abarca modalidades de visión, audio y lenguaje
- Produce excelentes resultados en tareas integradas incluso sin modelos preentrenados
- Con un potente Zero-shot Retrieval emergente, puede alinear modalidades no emparejadas en los datos de entrenamiento
- Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image
3 comentarios
Vaya, parece que es el mismo que publicaron la semana pasada. +_+
https://es.news.hada.io/topic?id=9249
Ups, copié algo equivocado ; como también se compartió por Slack, lo dejaré así.
(Como es importante, véanlo dos veces... snif, snif)
Sí, ¡gracias! 🙇🏼♂️
(¡Gracias a eso me enteré de que xguru lo sube directamente! 🤣)