9 puntos por xguru 2023-07-28 | 2 comentarios | Compartir por WhatsApp
  • El modelo de texto a imagen más avanzado
    • Más vívido que la versión anterior, con colores más precisos y mejor contraste, sombras e iluminación
    • 3.500 millones de parámetros
  • Puede generar imágenes con resolución de 1 megapíxel en solo unos segundos
  • Se puede personalizar y ajustar finamente para conceptos y estilos
  • También mejoró la generación de texto, con generación de texto avanzada y mejor legibilidad
  • Soporta inpainting, outpainting y prompts de imagen a imagen

2 comentarios

 
ninebow 2023-07-28

He generado automáticamente una explicación detallada del anuncio oficial con GPT-4.


Anuncio de SDXL 1.0 (ANNOUNCING SDXL 1.0)

Introducción

El equipo de Stability AI se enorgullece de lanzar SDXL 1.0 como un modelo abierto, la siguiente etapa en la evolución de los modelos de generación de imágenes a partir de texto. Después del lanzamiento limitado y solo para investigación de SDXL 0.9, la versión completa de SDXL ha sido mejorada hasta convertirse en el mejor modelo abierto de generación de imágenes del mundo.

Resumen

  • SDXL 1.0 es el modelo principal de imágenes de Stability AI y el mejor modelo abierto para generación de imágenes. Lo comparamos con varios otros modelos y concluimos que, en general, las personas prefieren las imágenes generadas por SDXL 1.0 por encima de las de otros modelos abiertos. Estos resultados provienen de varias semanas de datos de preferencias capturados de generaciones de modelos experimentales en nuestro Discord, así como de pruebas externas.

  • SDXL genera imágenes de alta calidad en prácticamente todos los estilos artísticos y es el mejor modelo abierto para fotorrealismo. Se pueden solicitar imágenes únicas sin una “sensación” específica impuesta por el modelo, lo que garantiza una libertad de estilo absoluta. SDXL 1.0 está especialmente bien ajustado para colores vivos y precisos, y ofrece mejor contraste, iluminación y sombras que su predecesor. Además, SDXL puede generar conceptos con los que los modelos de imágenes suelen tener dificultades al renderizar, como manos y texto, o composiciones organizadas espacialmente (por ejemplo, una mujer persiguiendo a un perro en el fondo).

  • SDXL requiere solo unas pocas palabras para generar imágenes complejas, detalladas y estéticamente satisfactorias. Los usuarios ya no necesitan usar términos calificativos como “obra maestra” para obtener imágenes de alta calidad. Además, SDXL puede entender la diferencia entre conceptos como "The Red Square" (el lugar famoso) y "red square" (la forma).

  • SDXL 1.0 tiene la mayor cantidad de parámetros entre los modelos de imágenes de acceso abierto y se basa en una nueva arquitectura innovadora compuesta por un modelo base de 3.5B parámetros y un refinador de 6.6B parámetros. El modelo completo consiste en un pipeline de mezcla de expertos para difusión latente: en la primera etapa, el modelo base genera latentes (con ruido), que luego son procesados adicionalmente por un modelo de refinamiento especializado en la etapa final de eliminación de ruido. Como referencia, el modelo base también puede usarse como un módulo independiente. Esta arquitectura de dos etapas ofrece un enfoque sólido para la generación de imágenes y produce resultados aún mejores.

Referencias

Stability AI Blog: El blog de Stability AI ofrece información detallada sobre las investigaciones y anuncios más recientes de la empresa. A través de este blog, puedes obtener información adicional sobre los modelos más recientes, como SDXL 1.0.
https://stability.ai/blog

Stable Diffusion: Este sitio web ofrece información detallada sobre la tecnología Stable Diffusion de Stability AI. Esta tecnología es un componente central de SDXL 1.0, y a través de este sitio puedes obtener una comprensión más profunda de ella.
https://stability.ai/stable-diffusion

Discord Community: Esta comunidad de Discord es un espacio donde investigadores y usuarios de Stability AI se reúnen para compartir y debatir su trabajo. A través de esta comunidad, puedes conocer las experiencias de otras personas que usan modelos como SDXL 1.0.
https://discord.gg/stablediffusion