Stable Video 3D: síntesis de nuevas vistas de alta calidad y generación 3D a partir de una sola imagen
- Se lanzó Stable Video 3D (SV3D), un modelo generativo basado en Stable Video Diffusion. Mejora significativamente la calidad de video y la consistencia entre vistas
- Incluye dos variantes: SV3D_u y SV3D_p
- SV3D_u genera un video orbital a partir de una sola imagen de entrada sin condiciones de cámara
- SV3D_p amplía esta capacidad para aceptar tanto una sola imagen como vistas orbitales, generando video 3D a lo largo de una ruta de cámara especificada
- Stable Video 3D puede usarse con fines comerciales a través de la membresía de Stability AI, y para usos no comerciales se pueden descargar los pesos del modelo en Hugging Face y consultar el artículo de investigación
Ventajas de Video Diffusion
- Al aplicar el modelo de difusión image-to-video Stable Video Diffusion con condiciones de trayectoria de cámara añadidas, Stable Video 3D puede generar videos multivista de objetos
- El uso de un modelo de Video Diffusion ofrece ventajas clave en generalización de los resultados generados y consistencia entre vistas, en comparación con el modelo de difusión de imágenes usado en Stable Zero123
- Además, aprovechando las sólidas capacidades de Stable Video 3D, se propone una optimización 3D mejorada para generar órbitas arbitrarias alrededor de objetos
Generación de nuevas vistas
- SV3D introduce avances importantes, especialmente en síntesis de nuevas vistas (NVS)
- Mientras que los enfoques anteriores a menudo enfrentan problemas de perspectivas limitadas e inconsistencias en los resultados, SV3D proporciona vistas consistentes desde cualquier ángulo dado
- Esta capacidad no solo mejora el control de la pose, sino que también asegura una apariencia consistente del objeto en múltiples vistas, mejorando aún más un aspecto clave de la generación 3D realista y precisa
Generación 3D
- SV3D aprovecha la consistencia multivista para optimizar campos de radiancia neurales 3D (NeRF) y representaciones de malla, mejorando la calidad de las mallas 3D generadas directamente a partir de nuevas vistas
- Para ello, se diseñó una pérdida de muestreo por destilación de puntaje enmascarado para mejorar aún más la calidad 3D en regiones no visibles desde las vistas predichas
- Además, SV3D utiliza un modelo de iluminación separado que se optimiza junto con la forma y la textura 3D para reducir el problema de la iluminación horneada
1 comentarios
Comentarios en Hacker News