- Comparación de 3 modelos con el mismo prompt en términos de precisión temática, precisión de estilo, cohesión y ética (Ethics)
Photography: Humans
- Actualmente, Midjourney lidera claramente en el área de fotografía, pero Firefly 2 le sigue muy de cerca
- Si quieres headshots menos estilizados y más naturales, conviene considerar Firefly 2 de ahora en adelante
- No es recomendable usar DALL-E 3 para fines fotográficos
Photography: Stylistic humans
- Últimamente se están creando muchas imágenes estilísticas de personas
- Como estos prompts fueron personalizados específicamente para Midjourney, puede haber un ligero sesgo
- Pero hay varios puntos clave:
- Midjourney funciona mejor cuando se le dan prompts más complejos y muestra una fuerte cohesión
- Midjourney sobresale al generar combinaciones complejas de medio, composición e iluminación
- DALL-E parece tener dificultades para integrar iluminación para personas de color, lo que reduce la precisión de los resultados
- Firefly genera los resultados más diversos cuando no se exige explícitamente diversidad
- Al intentar reemplazar fotografía más creativa, tanto Firefly como DALL-E 3 pueden tener dificultades para alcanzar el nivel deseado de calidad y cohesión
Photography: Objects
- Creo que Midjourney logra, en general, la cohesión de objetos más realista
- Firefly y DALL-E se están acercando, pero las preferencias de estilo de estos modelos sin duda influirán en los resultados
Illustration
- En ilustración, todos han avanzado bastante, pero para obtener resultados con matices, Midjourney sigue siendo la mejor opción
- Aun así, conviene experimentar con varios modelos y ajustarlos a tu estilo propio
Typography
- La posibilidad de generar palabras correctas solo se volvió real hace poco
- Entre todas las pruebas realizadas, solo DALL-E 3 renderizó las palabras fielmente como entidades completas
- En este caso particular, la palabra era "diseño", y la consistencia se mantuvo de forma uniforme en todos los experimentos
Conclusión
- El panorama definitivamente está cambiando, pero los puntos clave que quiero destacar son:
- Adobe claramente está cerrando la brecha en fotografía y se está convirtiendo en un competidor fuerte
- DALL-E 3 es el único generador que puede crear tipografía razonablemente bien (excepto Ideogram)
- DALL-E 3 sobresale en la creación de ilustraciones y, combinado con su capacidad para generar palabras, creo que tiene potencial para convertirse en un "generador de imágenes para clipart" en términos de escala y estilo generalizado
- Es adecuado para imágenes básicas o para generar imágenes durante otras actividades (a través de ChatGPT), pero no parece que vaya a convertirse pronto en una herramienta de diseño altamente sofisticada
- Midjourney sigue produciendo las fotografías más realistas y cohesionadas.
- En cuanto a control creativo, Midjourney no tiene rival
2 comentarios
¿Por qué quitaron StableDiffusion?
¿Fue por Midjourney?
Cuando probé DALL-E 3, me pareció increíble lo bien que podía representar texto con claridad.
Pero parece que, por ahora, Midjourney sigue teniendo la mejor calidad.