- Un framework que usa un modelo de difusión a gran escala para ajustar el punto de vista de la cámara a partir de una sola imagen RGB
- Aunque es un modelo entrenado con un dataset sintético, funciona bien en modo zero-shot incluso con imágenes reales o pinturas impresionistas, sin preentrenamiento adicional
- Usando este método de difusión para ajustar el punto de vista, también es posible reconstruir 3D a partir de una sola imagen
- Los resultados experimentales cualitativos y cuantitativos muestran que ofrece un rendimiento muy superior al de otros modelos gracias al preentrenamiento a escala de internet
1 comentarios
Hasta el año pasado pensaba que todavía faltaba mucho,
pero últimamente aparece una nueva tecnología y nuevos resultados día por medio..