28 puntos por xguru 2023-06-09 | 9 comentarios | Compartir por WhatsApp
  • Un usuario de Reddit llamado nhciao generó códigos QR con estilo anime que realmente funcionan usando ControlNet + LoRA
  • Esto es posible gracias a la función de corrección de errores que tienen originalmente los códigos QR
  • Puede aplicarse de muchas formas distintas, como patrones tradicionales chinos, ukiyo-e, animación 2D, pintura con tinta, acuarela, arte tridimensional, abstracto, PCB y más
  • Los detalles se pueden consultar en la publicación original escrita en chino

9 comentarios

 
yinn27 2023-06-10

Impresionante la idea...

 
qkreoaksn 2023-06-09

Dios mío.....

 
popup 2023-06-09

Parece que sí reconoce el QR al probarlo. Qué curioso.

 
kuroneko 2023-06-09

En teoría entiendo que es posible, pero aun así no me cabe en la cabeza que eso de verdad se pueda escanear. Es increíblemente fascinante.

 
xguru 2023-06-09

Publicación de blog en chino: https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw

 
kuroneko 2023-06-09

Al poner el artículo original en un resumidor, sale algo así.

  • Este artículo habla de un nuevo modelo de ControlNet capaz de generar imágenes de códigos QR escaneables. ControlNet puede codificar información oculta en imágenes que para el ojo humano parecen normales.
  • El autor y sus compañeros ya antes habían creado un generador de códigos QR parametrizado, pero no siguieron actualizándolo. La idea actual surgió después del lanzamiento de Stable Diffusion.
  • El primer intento con ControlNet fue entrenarlo con patrones tradicionales chinos. El autor menciona que realizó el entrenamiento usando la documentación de AIGC All in One y HuggingFace JAX/Diffusers.
  • Para entrenar ControlNet se necesita una gran cantidad de datos y poder de cómputo. En la investigación se usaron hasta 300,000 imágenes y 600 horas de GPU A100. El autor entrenó una versión con 100,000 imágenes usando una tasa de aprendizaje alta.
  • Después del entrenamiento, el autor probó varias combinaciones de Checkpoint + LoRA + QR Code ControlNet para generar códigos QR escaneables en distintos estilos, como patrones tradicionales chinos, ukiyo-e, 2D, tinta, perspectiva, abstracto y estilo PCB.
  • Los códigos QR generados incluyen estilos de patrones tradicionales chinos, ukiyo-e, animación, ilustración, tinta, acuarela, 3D y abstracto.
  • Este proyecto dependió de la colaboración con varios compañeros y de los recursos de GPU del laboratorio. Los servidores TPU de Google también ayudaron a acelerar el entrenamiento.
  • El autor planea publicar más adelante el modelo y la documentación técnica en la cuenta oficial de WeChat y en el sitio web.
  • El artículo menciona que los modelos de generación por IA están avanzando rápidamente y expresa el deseo de volver a la universidad.
  • El autor agradece a Google y HuggingFace por proporcionar los servidores TPU, diciendo que pudo "pasarla bien".
 
lunamoth 2023-06-09

¿Podrías decirme qué servicio usaste para el resumidor?

 
kuroneko 2023-06-11

Estoy usando Universal Summarizer de Kagi.

 
lunamoth 2023-06-11

Gracias por avisar.