DeepFloyd IF - modelo open source de texto a imagen
(github.com/deep-floyd)- El nuevo modelo de imágenes de Stability AI
- Tiene una mayor comprensión del lenguaje en comparación con los modelos existentes y genera imágenes fotorrealistas
- Combinación de un codificador de texto congelado basado en T5 Transformer y un módulo de difusión de píxeles de 3 etapas
- 64x64, 256x256, 1024x1024px
- Puntaje FID zero-shot de 6.66 (dataset COCO)
Aún no hay comentarios.