- Stable Diffusion 3 es el modelo de texto-imagen más destacado, y ofrece una mejora de rendimiento significativa en prompts de múltiples temas, calidad de imagen y capacidad de ortografía.
- Aún no está disponible de forma amplia, pero comenzó el registro en lista de espera para el early preview.
- Al igual que con los modelos anteriores, esta fase de vista previa es clave para obtener conocimientos que ayuden a mejorar el rendimiento y la seguridad.
Alcance y tecnología del modelo
- La suite de modelos Stable Diffusion 3 abarca un rango de 800M a 8B parámetros.
- Este enfoque está alineado con el valor principal y el objetivo de hacerlo accesible para todos, ofreciendo una variedad de opciones de escalabilidad y calidad que se ajustan mejor a las necesidades creativas de los usuarios.
- SD3 combina la arquitectura Diffusion Transformer con Flow Matching.
- El informe técnico detallado se anunciará próximamente.
Práctica de IA segura y responsable
- Se toma muy en serio la IA segura y responsable.
- Se están tomando medidas razonables para prevenir el mal uso de Stable Diffusion 3 y se mantienen de forma constante durante todo el proceso de entrenamiento, prueba, evaluación y despliegue del modelo.
- Al preparar la vista previa temprana, se han incorporado múltiples medidas de seguridad.
- Se espera innovar aún más al abrir el acceso al modelo, mediante una colaboración continua con investigadores, expertos y la comunidad.
Compromiso y activación de la creatividad
- La promesa de una IA generativa abierta, segura y de acceso universal es firme.
- Con Stable Diffusion 3, se ofrecerán soluciones adaptables para que personas, desarrolladores y empresas puedan potenciar su creatividad.
- Si quieres usar otro modelo de imagen con fines comerciales antes del lanzamiento de Stable Diffusion 3, puedes visitar la página de membresía de Stability AI o acceder a la API a través de la plataforma para desarrolladores.
1 comentarios
Opinión de Hacker News
Se usa un nuevo tipo de transformador de difusión que combina flow matching y otras mejoras.
La obsesión con la seguridad parece haber perdido una oportunidad de marketing, considerando el reciente incidente de Gemini.
Teniendo en cuenta el ambiente de censura actual, será interesante ver qué significa “seguridad” esta vez.
La mitad del comunicado de lanzamiento dice que “realmente somos responsables y seguros”.
Las imágenes de la demo son todas "artworks".
Ha habido un gran avance en texto/ortografía.
Reescribieron la sección de “seguridad”, pero reemplazando la herramienta de IA por un cuchillo imaginario llamado “Big Knife”.