NVIDIA presenta 'Perfusion', un modelo de generación de imágenes personalizadas de 100 kB
(research.nvidia.com)NVIDIA presentó recientemente, a través de 'Key_Locked Rank One Editing for Text-to-Image Personalization', aceptado en SIGGRAPH 2023, el modelo 'Perfusion', que permite generar imágenes personalizadas con un tamaño de 100 kB y alrededor de 4 minutos de entrenamiento.
No se trata de crear una imagen completa únicamente a partir de texto, sino de un método en el que se ingresan algunas imágenes de ejemplo para definir un concepto y luego, al introducir un texto que incluya ese concepto, se genera una imagen acorde.
Los resultados mostrados en la página de presentación y en el paper se ven impresionantes.
Dicen que el código se publicará pronto.
1 comentarios
No será algo así como 4 minutos en una A100... ¿verdad?