-
PabloNet
-
Creo que el debate sobre si una IA conectada a internet puede ser creativa está alejado del tema esencial. El arte revela el mundo interior, y la tecnología es solo una parte de eso. Es lamentable que el arte exija demasiada técnica. Parece haber una posibilidad de separar ambos elementos. Una creatividad interpolada y económica, usada por 8 mil millones de no artistas, podría revelar una nueva visión del mundo.
-
Por estas razones, yo, que no tengo talento para el arte, estoy muy interesado en diversas formas de arte basadas en IA. Hace unos meses comencé a trabajar con StreamDiffusion para difundir en tiempo real la señal de una webcam. Quería generar efectos visuales hermosos y provocar nuevas emociones. Pero el formato de laptop rompía la ilusión. Así que recientemente fabriqué un marco LCD que se puede colgar en la pared para reducir al mínimo los elementos que rompen esa ilusión. La mayor ventaja de esta configuración es que abre un nuevo canal de interacción como objeto permanente, y no como una simple pantalla.
-
El principal problema de la configuración actual es la baja tasa de cuadros. Mejoré la velocidad usando TensorRT y compresión de imagen, pero todavía hay mucho margen de mejora.
-
Para quienes estén interesados, comparto cómo construirlo y cómo contribuir:
- Se proporciona el código del cliente y del servidor
- El hosting del servidor usa RunPod
- El cliente corre en una Raspberry Pi 5
- Usa una pantalla Pi de 10.1 pulgadas
- Usa iluminación infrarroja
- Usa un marco común
- Usa una cámara Pi infrarroja
- Se usa un punzón para hacer el agujero de la cámara (el taladro no funciona)
- Se experimentó con varios filtros de preprocesamiento; no basta con un prompt simple.
img2imgse ve demasiado realista sin preprocesamiento. Para lograr el estilo azul tipo Picasso que aparece en esta publicación, se usó una mezcla de detección de bordes Canny, teñido azul y desenfoque.
Resumen de GN⁺
- El arte basado en IA muestra la posibilidad de ofrecer nuevas perspectivas al separar la técnica y la creatividad.
- La difusión en tiempo real de la señal de webcam con StreamDiffusion ofrece nuevas emociones y experiencias visuales.
- La instalación con un marco LCD abre posibilidades más allá de una simple pantalla, como una obra de arte permanente.
- Los problemas técnicos, como la baja tasa de cuadros, todavía tienen margen de mejora.
- Como proyectos con funciones similares, se recomiendan DeepArt.io y RunwayML.
1 comentarios
Opiniones de Hacker News
Codificar bytes JPEG en Base64 aumenta el tamaño del payload en aproximadamente 30% y consume ciclos de CPU tanto del cliente como del servidor. El protocolo WebSocket puede transmitir payloads binarios, así que no hay necesidad de convertirlos a texto
El arte revela el mundo interior, y la técnica es solo una parte. Se cuestiona la idea de que la brecha técnica sea simplemente una incomodidad
No se habla del valor artístico, pero como coleccionista de herramientas hay una parte interesante
Se piensa que sería más genial si la cámara estuviera en otro lugar y no en el marco. Ver un espejo artístico es un poco aburrido
Siempre se ha pensado que el arte preserva y crea emociones. El plátano en la pared también es arte, y la música popular sigue siendo arte
Se pregunta si se ha considerado un efecto de transformación de alta tasa de cuadros entre imágenes. Eso aumentaría la tasa de cuadros efectiva y se vería genial
El principal problema de la configuración actual es la baja tasa de cuadros. Se considera una característica, ya que no está mal tener tiempo para procesar la imagen
Se otorga el premio al espejo que más energía consume. Se observa que la pintura no es estable frente a pequeños cambios en la entrada
Se pregunta si hay alguna forma de fijar algunas imágenes. Se cree que algunas se verían bien si se conservaran (por ejemplo, una foto de perfil o una imagen de pantalla de bloqueo)