Google presenta la IA de texto a video "Imagen Video"

xguru · 2022-10-07T10:52:01+09:00

Un "Text-conditional Video Generation System" que recibe texto y crea videos usando un Video Diffusion Model Su característica es que genera videos de baja resolución a partir de texto (24x48 píxeles, 16 fotogramas, 3 fps) y luego los reescala superponiendo en cascada 7 modelos de difusión La salida final es de 1280x768 a 24 fps. Puede generar un video de 5.3 segundos de duración Paper: Imagen Video : High Definition Video Generation with Diffusion Models

(imagen.research.google)

9 puntos por xguru 2022-10-07 | 1 comentarios | Compartir por WhatsApp

Un "Text-conditional Video Generation System" que recibe texto y crea videos usando un Video Diffusion Model
Su característica es que genera videos de baja resolución a partir de texto (24x48 píxeles, 16 fotogramas, 3 fps) y luego los reescala superponiendo en cascada 7 modelos de difusión
La salida final es de 1280x768 a 24 fps. Puede generar un video de 5.3 segundos de duración
Paper: Imagen Video : High Definition Video Generation with Diffusion Models

1 comentarios

xguru 2022-10-07

Imagen - el modelo de difusión de texto a imagen de Google
Imagen-pytorch - implementación de Google Imagen en Pytorch
Make-A-Video : IA que genera video a partir de texto

Google presenta la IA de texto a video "Imagen Video"

Lecturas relacionadas

1 comentarios