10 puntos por xguru 2024-10-24 | Aún no hay comentarios. | Compartir por WhatsApp
  • Incluye varias versiones del modelo que pueden ejecutarse en hardware de consumo y personalizarse con flexibilidad, y es gratis para la mayoría de los casos de uso
  • Se pueden descargar los modelos Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo desde Hugging Face, y el código de inferencia desde GitHub
  • Modelos lanzados
    • Stable Diffusion 3.5 Large: modelo base con 8 mil millones de parámetros, el más potente de la familia Stable Diffusion. Ideal para casos de uso profesionales en resolución de 1 megapíxel
    • Stable Diffusion 3.5 Large Turbo: versión destilada de Stable Diffusion 3.5 Large que genera imágenes de alta calidad con excelente adherencia al prompt en solo 4 pasos. Es considerablemente más rápido que Stable Diffusion 3.5 Large
    • Stable Diffusion 3.5 Medium (previsto para lanzarse el 29 de octubre): tiene 2.5 mil millones de parámetros y fue diseñado para ejecutarse directamente en hardware de consumo gracias a una arquitectura MMDiT-X mejorada y a métodos de entrenamiento optimizados. Equilibra calidad y facilidad de personalización. Puede generar imágenes con resoluciones de 0.25 a 2 megapíxeles

Proceso de desarrollo del modelo

  • Al desarrollar el modelo, se priorizó la posibilidad de personalización para ofrecer una base flexible
  • Para ello, se integró Query-Key Normalization en los bloques del transformer para estabilizar el proceso de entrenamiento del modelo y simplificar el ajuste fino y el desarrollo adicional
  • Fue necesario aceptar algunos trade-offs para dar soporte a la flexibilidad downstream
  • Al cambiar la semilla con el mismo prompt, la variabilidad en la salida puede aumentar. Esto fue intencional para ayudar a conservar una base de conocimiento más amplia y estilos diversos en el modelo base
  • Sin embargo, los prompts con poca especificidad pueden incrementar la incertidumbre en la salida, y el nivel estético puede variar
  • En el caso del modelo Medium, la arquitectura y el protocolo de entrenamiento se ajustaron varias veces para mejorar la calidad, la consistencia y la capacidad de generación en múltiples resoluciones

Ventajas de Stable Diffusion 3.5

  • Facilidad de personalización: permite ajustar fácilmente el modelo a necesidades creativas específicas o crear aplicaciones basadas en flujos de trabajo personalizados
  • Rendimiento eficiente: especialmente los modelos Stable Diffusion 3.5 Medium y Stable Diffusion 3.5 Large Turbo están optimizados para ejecutarse en hardware de consumo estándar sin requisitos pesados
  • Salidas diversas: puede generar imágenes que representan a personas de todo el mundo con distintos tonos de piel y rasgos, incluso sin prompting extenso
  • Stable Diffusion 3.5 Large lidera el mercado en adherencia al prompt y ofrece una calidad de imagen comparable a la de modelos mucho más grandes
  • Stable Diffusion 3.5 Large Turbo ofrece el tiempo de inferencia más rápido en relación con su tamaño, manteniéndose muy competitivo en calidad de imagen y adherencia al prompt
  • Stable Diffusion 3.5 Medium supera a otros modelos de tamaño medio y ofrece un rendimiento eficiente y de alta calidad al equilibrar adherencia al prompt y calidad de imagen

Resumen de la Stability AI Community License

  • Gratis para uso no comercial: personas y organizaciones pueden usarlo sin costo para fines no comerciales, incluida la investigación científica
  • Gratis para uso comercial con ingresos anuales de hasta 1 millón de dólares: startups, pymes y creadores pueden usarlo sin costo con fines comerciales si sus ingresos anuales son menores a 1 millón de dólares
  • Propiedad de los resultados: es posible conservar la propiedad del contenido generado sin implicaciones de licenciamiento restrictivo
  • Las organizaciones con ingresos anuales superiores a 1 millón de dólares pueden contactar a Stability AI para consultar una licencia empresarial

Cómo acceder al modelo

  • Los pesos del modelo ya están disponibles en Hugging Face para self-hosting
  • También se puede acceder al modelo a través de plataformas como Stability AI API, Replicate, ComfyUI y DeepInfra

Compromiso de Stability AI con la seguridad

  • Stability AI cree en prácticas de IA seguras y responsables, y ha tomado medidas deliberadas desde las primeras etapas del desarrollo para asegurar la integridad
  • Está tomando medidas razonables para prevenir el uso indebido de Stable Diffusion 3.5 por parte de actores maliciosos

Próximos planes

  • Está previsto el lanzamiento público de Stable Diffusion 3.5 Medium el 29 de octubre
  • Poco después, se lanzarán ControlNets con funciones avanzadas de control para diversos casos de uso profesionales

Aún no hay comentarios.

Aún no hay comentarios.