Exploración sobre la generación de imágenes con GPT y los problemas de copyright
- Tras la actualización de la función de generación de imágenes de GPT, se expandió entre los usuarios de internet la tendencia de convertir distintos contenidos al estilo de Studio Ghibli
- Un caso representativo son las imágenes que recrean en estilo Ghibli el meme de ‘Disaster Girl’
- Esto también sirve como ejemplo del avance técnico que permite a la IA reproducir fácilmente estilos artísticos extremadamente intensivos en trabajo
- Pero al mismo tiempo, también existe la incomodidad de que se sienta como una ‘imitación’ que elimina la sensibilidad única y la humanidad del autor original
- Imitación y creatividad
- Coco Chanel dijo que no hay nada peor que la imitación, mientras que Orson Welles mencionó que la creatividad tiene más valor que la imitación.
- Wilson Mizner expresó que copiar una cosa es plagio, pero copiar dos es investigación.
Las emociones complejas del estilo Studio Ghibli
- Studio Ghibli es un estudio de animación famoso por su artesanía, al punto de dedicar más de un año de trabajo a una sola escena de 4 segundos
- Convertir imágenes a estilo Ghibli con GPT imita esa dedicación artística y, al mismo tiempo, la parodia mediante la velocidad y la eficiencia
- Esto deja ver un escepticismo cultural frente a que la IA imite solo el estilo sin contar con sensibilidad ni experiencia humanas
El experimento de evasión de IP con GPT
- El autor hizo que GPT generara dibujos sin mencionar directamente IP protegida por copyright, usando prompts descritos de forma indirecta
- Ej.: “un aventurero arqueólogo con sombrero y látigo” → genera una imagen que recuerda a Indiana Jones
- “un hombre musculoso que pelea contra un villano con cara de calavera” → aparece una imagen de He-Man
- Este proceso fue el resultado de un experimento sobre qué tan fácilmente la IA puede ‘imitar’ IP existentes
- El hecho de que, solo con prompts, la IA pueda recrear con precisión ciertos personajes o estilos plantea preocupaciones sobre la evasión del copyright
La frontera entre copyright e imitación
- GPT aprendió durante su entrenamiento innumerables estilos visuales, y a menudo estos provienen de imágenes con copyright
- Según Business Insider, “la imitación de un estilo podría estar permitida por la ley de copyright”
- Sin embargo, la imitación de GPT va más allá de una simple copia de estilo y termina generando personajes sustancialmente idénticos o muy similares
El ‘ideal platónico’ que generan los LLM
- Las imágenes generadas por GPT suelen acercarse a un “tipo ideal” y ofrecen visuales más cercanos a la esencia que los resultados de búsqueda reales
- Ej.: una imagen de un “agente secreto británico” → produce un resultado que recuerda a un 007 con estilo Craig/Brosnan
- Esto revela algo interesante: que los LLM aprenden como los humanos y forman patrones cognitivos parecidos a los nuestros
El avance de la IA y el futuro del debate sobre copyright
- GPT es una tecnología que muestra tanto infracción de copyright como una sorprendente capacidad creativa
- La expansión de los memes al estilo Studio Ghibli sugiere que las herramientas de IA pueden resultar igual de atractivas aun cuando dañen la esencia del arte original
- Los usuarios necesitan reconocer que, al mismo tiempo que disfrutan los beneficios del avance tecnológico, este está desdibujando los límites de la propiedad intelectual
Conclusión: una elección que depende de nosotros
- La IA está poniendo a prueba la creatividad al ‘imitar’ la creación de forma cada vez más sofisticada
- La dirección de esta tecnología y su uso ético son responsabilidad de los usuarios y los desarrolladores
- Como en la cita final del post:
> "Tú tienes el poder. No te detengas."
2 comentarios
Es AI abierta, pero no está abierta, y la PI sí debería ser abierta.. Aprendió de la PI de otros, ¿pero el modelo es su propia PI? Al final, creo que lo correcto sería abrir el modelo. (cobrar en la capa de servicio)
Opiniones de Hacker News
Esperaba que la discusión sobre el arte con IA llevara a una crítica de la propiedad intelectual, los sistemas de regalías y las leyes de copyright estrictas
Una opinión sobre que los sitios web modernos de internet existan sin que la barra de desplazamiento esté rota
Está permitido dibujar IP o tomar una captura de pantalla y usar Photoshop
Que un modelo de IA genere una copia 1:1 de los datos de entrenamiento parece un caso grave de sobreajuste
Sería interesante evaluar y modificar las propiedades físicas de los personajes generados por IA
Una postura en contra de la propiedad intelectual
No es cierto que las empresas intenten hacerte creer que poseen y controlan toda salida de audio o visual que produzcan
Los LLM y la búsqueda en internet son distintos, pero como los LLM aprenden de todo internet, parece que habrá superposición
La instrucción sugiere un personaje bien conocido y no deja claro que no se quiera la obra original