Imagen - el modelo de difusión de texto a imagen de Google
(imagen.research.google)- Un modelo de IA que genera imágenes realistas al comprender el lenguaje a un nivel profundo
- En evaluaciones con personas, genera imágenes preferidas por encima de las de DALL-E 2 de OpenAI
→ En términos de calidad y alineación entre imagen y texto - Solo se publicaron el artículo de investigación y las imágenes de ejemplo
→ Se decidió no publicar una versión de demostración utilizable externamente debido a cuestiones éticas, entre otras
2 comentarios
Ayer vi en una librería un libro de Alicia en el país de las maravillas con fotogramas de animación de Disney insertados como ilustraciones, y me da curiosidad qué resultado saldría si se ingresara cada escena de Alicia en el país de las maravillas en un modelo así.
Presentación de DALL·E 2
¿Cómo funciona DALL-E 2?