- Los humanos pueden percibir un mundo 3D incluso en imágenes que no tienen consistencia 3D
- Toon3D puede recuperar la pose de la cámara y geometría de alta densidad mediante optimización deformable piecewise-rigid
- Las escenas dibujadas a mano no tienen consistencia 3D, pero con Toon3D se pueden recuperar e interpolar nuevas vistas nunca antes vistas
Abstract
- Propuesta de Toon3D
- Recupera la estructura 3D subyacente de escenas sin consistencia geométrica
- Se enfoca en imágenes dibujadas a mano de cómics y animación
- Muchos cómics son dibujados directamente por artistas sin usar un motor de renderizado 3D
- Las imágenes dibujadas a mano representan el mundo con fidelidad cualitativa, pero es difícil dibujar múltiples puntos de vista con consistencia 3D
- Las personas pueden reconocer fácilmente una escena 3D incluso con entradas inconsistentes
- Corrige las inconsistencias de los dibujos 2D para que las nuevas imágenes deformadas sean consistentes entre sí
- Recupera estructura densa mediante una herramienta de anotación amigable para el usuario, estimación de pose de cámara y deformación de imágenes
- Puede integrarse en métodos de reconstrucción para generación de nuevas vistas deformando las imágenes para ajustarlas a un modelo de cámara en perspectiva
Reconstrucción de cómics
- Primero recupera la pose de la cámara y una nube de puntos alineada
- Inicializa gaussianas desde una nube de puntos densa y optimiza Gaussian Splatting con las cámaras recuperadas
- Tiene regularización de profundidad y está construido sobre Nerfstudio
- Muestra un render de recorrido de vuelo por la escena
Método
- Predice la profundidad de cada imagen con Marigold y obtiene máscaras temporales candidatas con SAM
- Etiqueta las imágenes con Toon3D Labeler para obtener correspondencias y marcar regiones temporales
- Optimiza la pose de la cámara y deforma las imágenes para obtener una cámara en perspectiva corregida
- Inicializa gaussianas con una nube de puntos densa alineada y ejecuta el refinamiento
Toon3D Labeler
- Muestra dos pasos principales del método
- Video de alineación dispersa: estimación aproximada de parámetros de cámara
- Video de alineación densa: muestra cómo alinear en 3D usando varias capas (cámara, correspondencias dispersas, malla de deformación, etc.)
Exploración del interior de la casa de Rick and Morty
- Reconstruye el interior de la casa de Rick and Morty conectando habitaciones mediante el etiquetado de paredes y techos
- El primer video muestra la nube de puntos, las cámaras y una interfaz de etiquetado personalizada
- En el segundo video, se puede recorrer el interior de la casa moviendo el deslizador
Nube de puntos y cámaras
- Muestra la nube de puntos y las cámaras recuperadas para 12 escenas de cómics del dataset Toon3D
- Se puede explorar cada escena haciendo clic en los íconos
Reconstrucción con vistas dispersas
- Puede reconstruir una escena con pocas imágenes y grandes cambios de punto de vista
- Donde COLMAP puede fallar, se puede intervenir obteniendo correspondencias etiquetadas por humanos con Toon3D Labeler
- Muestra renders de recorrido de vuelo para dos habitaciones de un anuncio de Airbnb ("sala" y "habitación 2")
Visualización de inconsistencias
- Como los cómics fueron dibujados a mano, las imágenes deben deformarse para que sean consistentes en 3D
- Primer elemento: video donde ocurre la deformación durante la optimización de alineación
- Los dos siguientes elementos: imágenes que muestran el dibujo original y el deformado, junto con la superposición entre ambos
- Las áreas borrosas indican dónde ocurrió mucha deformación
Reconstrucción de dibujos
- Toon3D también puede reconstruir dibujos hechos a mano
- Predice la profundidad de cada imagen, luego alinea y deforma la nube de puntos
- Finalmente genera un video usando refinamiento gaussiano
Opinión de GN⁺
- Toon3D es un método innovador para reconstruir en 3D imágenes dibujadas a mano de cómics y animación
- Esta tecnología ofrece una nueva experiencia visual y podría ser especialmente útil en producción de animación y desarrollo de videojuegos
- Sin embargo, el proceso de etiquetado manual puede ser algo engorroso, y sería ideal que los métodos automatizados siguieran mejorando
- Otros proyectos con funciones similares incluyen COLMAP y Nerfstudio
- Al adoptar esta tecnología, el etiquetado preciso y la predicción de profundidad son importantes para lograr una reconstrucción 3D más consistente
1 comentarios
Opiniones en Hacker News
Resumen de comentarios de Hacker News
Ejemplo del edificio Planet Express de Futurama
La diversión de generar espacios 3D
Posibilidades futuras para generar modelos 3D
El problema de convertir arte 2D a 3D
Fotogrametría y VR
Necesidad de mejorar el algoritmo
Problema de reproducción automática de videos en el sitio
La reacción de Miyazaki
Resultados por debajo de las expectativas