Imagen - el modelo de difusión de texto a imagen de Google

xguru · 2022-05-25T09:32:41+09:00

Un modelo de IA que genera imágenes realistas al comprender el lenguaje a un nivel profundo En evaluaciones con personas, genera imágenes preferidas por encima de las de DALL-E 2 de OpenAI → En términos de calidad y alineación entre imagen y texto Solo se publicaron el artículo de investigación y las imágenes de ejemplo → Se decidió no publicar una versión de demostración utilizable externamente debido a cuestiones éticas, entre otras

(imagen.research.google)

10 puntos por xguru 2022-05-25 | 2 comentarios | Compartir por WhatsApp

Un modelo de IA que genera imágenes realistas al comprender el lenguaje a un nivel profundo
En evaluaciones con personas, genera imágenes preferidas por encima de las de DALL-E 2 de OpenAI
→ En términos de calidad y alineación entre imagen y texto
Solo se publicaron el artículo de investigación y las imágenes de ejemplo
→ Se decidió no publicar una versión de demostración utilizable externamente debido a cuestiones éticas, entre otras

2 comentarios

kunggom 2022-05-25

Ayer vi en una librería un libro de Alicia en el país de las maravillas con fotogramas de animación de Disney insertados como ilustraciones, y me da curiosidad qué resultado saldría si se ingresara cada escena de Alicia en el país de las maravillas en un modelo así.

xguru 2022-05-25

Presentación de DALL·E 2
¿Cómo funciona DALL-E 2?

Imagen - el modelo de difusión de texto a imagen de Google

Lecturas relacionadas

2 comentarios