8 puntos por lostdest 2023-08-03 | 1 comentarios | Compartir por WhatsApp

NVIDIA presentó recientemente, a través de 'Key_Locked Rank One Editing for Text-to-Image Personalization', aceptado en SIGGRAPH 2023, el modelo 'Perfusion', que permite generar imágenes personalizadas con un tamaño de 100 kB y alrededor de 4 minutos de entrenamiento.

No se trata de crear una imagen completa únicamente a partir de texto, sino de un método en el que se ingresan algunas imágenes de ejemplo para definir un concepto y luego, al introducir un texto que incluya ese concepto, se genera una imagen acorde.

Los resultados mostrados en la página de presentación y en el paper se ven impresionantes.
Dicen que el código se publicará pronto.

1 comentarios

 
hhkkkk 2023-08-03

No será algo así como 4 minutos en una A100... ¿verdad?