- El modelo de texto a imagen open source SOTA más grande desarrollado por Black Forest Labs
- El equipo original que desarrolló Stable Diffusion
- Con 12B parámetros, amplía los límites de la creatividad y el rendimiento, ofreciendo capacidades de generación de imágenes similares a Midjourney
Disponible en 3 modelos
- FLUX.1 [dev]: modelo base open source bajo una licencia no comercial. La comunidad puede construir sobre él
- FLUX.1 [schnell]: versión destilada del modelo base que funciona hasta 10 veces más rápido. Licencia Apache 2.
- FLUX.1 [pro]: versión cerrada disponible solo mediante API
Características principales
- Mejor calidad de imagen: permite generar visuales sorprendentes en alta resolución
- Anatomía humana avanzada y fotorrealismo: permite generar imágenes muy realistas y anatómicamente precisas
- Mejor seguimiento de prompts: permite generar imágenes más precisas y relevantes basadas en la entrada
- Velocidad sobresaliente: la velocidad y eficiencia de Flux Schnell lo hacen ideal para aplicaciones de alta demanda
Integración de fal
- Integra el motor de inferencia de última generación de fal para ejecutar los modelos Flux hasta 2 veces más rápido que eager torch
- Tiempos de procesamiento rápidos manteniendo una calidad y nivel de detalle sobresalientes
Resumen de GN⁺
- Flux es el más reciente modelo de texto a imagen desarrollado por Black Forest Labs y establece un nuevo estándar de creatividad y rendimiento
- Ofrece soluciones personalizadas para distintos casos de uso mediante varias variantes del modelo
- Su mejor calidad de imagen y representación realista lo hacen adecuado para aplicaciones de alta demanda
- El motor de inferencia de fal permite una ejecución aún más rápida y eficiente del modelo
- Otros proyectos con funciones similares incluyen DALL-E y Midjourney
1 comentarios
Comentarios en Hacker News
burkay de fal.ai: el modelo no fue creado por fal, sino por Black Forest Labs
Otro usuario: la mayoría de las comparaciones no prueban bien el modelo nuevo
Otro usuario: hizo pruebas usando prompts de ideogram, y Flux genera imágenes muy buenas
Otro usuario: cada vez que ve un modelo nuevo, revisa si puede crear diagramas de ingeniería
Otro usuario: el proceso de registro es engorroso
Otro usuario: las startups financiadas con capital de riesgo siguen lanzando modelos gratis sin tener un modelo de negocio
Otro usuario: la calidad es impresionante
Otro usuario: no maneja bien las relaciones espaciales