- Un nuevo pipeline rápido y de vanguardia para generar assets 3D a partir de texto
- 3DGen puede generar geometría y texturas 3D de alta calidad y con gran fidelidad al prompt en menos de un minuto
- Soporta PBR (renderizado basado en física), necesario para el relighting de assets 3D en aplicaciones del mundo real
- Puede modificar de forma generativa la materialidad de geometrías 3D previamente generadas (o creadas por artistas) usando entradas de texto adicionales proporcionadas por el usuario
- 3DGen integra dos componentes tecnológicos clave desarrollados por Meta: Meta 3D AssetGen y Meta 3D TextureGen, para generación de 3D a partir de texto y generación de texturas a partir de texto
- Al combinar estas dos tecnologías, 3DGen representa objetos 3D simultáneamente de tres maneras: en espacio de vista, espacio volumétrico y espacio UV (o de textura)
- Logra una tasa de victoria del 68% frente a modelos de una sola etapa
- 3DGen no solo supera los benchmarks de la industria en fidelidad al prompt y calidad visual para prompts de texto complejos, sino que además es mucho más rápido
Artículos relacionados
Meta 3D AssetGen: generación de texto a malla con geometría, textura y materiales PBR de alta calidad
- AssetGen representa un avance importante en la generación 3D a partir de texto al producir mallas fieles y de alta calidad con control sobre textura y materiales
- A diferencia de hornear el sombreado en la apariencia de los objetos 3D, AssetGen genera materiales PBR que permiten relighting real
- AssetGen primero genera múltiples vistas del objeto con canales de apariencia factorizados de sombreado y albedo, y luego reconstruye color, metalicidad y rugosidad en 3D usando una pérdida de sombreado diferido para una supervisión eficiente
- También usa funciones de distancia con signo para representar la geometría 3D de forma más estable e introduce la pérdida correspondiente para supervisión geométrica directa
- Tras la extracción de la malla, un transformador de refinamiento de texturas que opera en espacio UV mejora significativamente la nitidez y el detalle
- AssetGen logra mejoras del 17% en distancia Chamfer y del 40% en LPIPS frente al mejor trabajo concurrente para reconstrucción con pocas vistas, y obtiene una preferencia humana del 72% frente al mejor competidor de la industria con velocidad similar y soporte PBR
Meta 3D TextureGen: generación rápida y consistente de texturas para objetos 3D
- La reciente disponibilidad y adaptabilidad de los modelos de texto a imagen ha abierto una nueva era en muchos campos relacionados, como la generación de texturas
- Los métodos recientes de generación de texturas logran resultados impresionantes usando redes de texto a imagen, pero la combinación de consistencia global, calidad y velocidad es clave para llevar esta tecnología a aplicaciones reales
- Se presenta Meta 3D TextureGen, un nuevo método feed-forward compuesto por dos redes secuenciales para generar texturas de alta calidad y globalmente consistentes en menos de 20 segundos sobre geometría arbitraria
- 3DGen logra resultados de vanguardia en calidad y velocidad al condicionar modelos de texto a imagen sobre semántica 3D en espacio 2D y fusionarlos en mapas de textura UV completos y de alta resolución
- También introduce una red de mejora de texturas capaz de escalar texturas a proporciones arbitrarias para generar texturas con resolución de 4k píxeles
Opinión de GN+
- 3DGen parece un avance revolucionario en el campo de la generación de assets 3D. La capacidad de crear rápidamente modelos 3D de alta calidad a partir de prompts de texto podría aplicarse en áreas como videojuegos, cine y diseño
- En particular, se espera que el soporte para materiales PBR y la capacidad de cambiar las texturas de modelos 3D ya creados aumenten su utilidad en la práctica
- Aun así, interpretar con precisión el significado de un prompt de texto y generar un modelo 3D exactamente como se pretende probablemente seguirá siendo un reto difícil. También parece necesario que avance la ingeniería de prompts
- Da curiosidad ver cómo los especialistas en modelado 3D aprovecharán esta tecnología y qué impacto tendrá en la expresión creativa. También haría falta comparar sus diferencias, ventajas y desventajas frente a las herramientas de modelado 3D existentes
- También existen otras soluciones con funciones similares, como GET3D de Nvidia e Imagine 3D de Luma Lab. Haría falta un análisis comparativo de sus ventajas y desventajas en rendimiento y usabilidad
- A medida que la tecnología de generación de modelos 3D avance y cualquier persona pueda crear fácilmente el modelo 3D que desee, podrían surgir nuevos temas como los derechos de autor de los modelos 3D y su posible uso indebido. Parece necesario un debate social y la construcción de consensos al respecto
1 comentarios
Opiniones en Hacker News
Un usuario ve de forma positiva los avances del modelado 3D como un aspecto clave de la IA generativa, y menciona en particular la dificultad de crear recursos para VR
Otro usuario señala que la creación de contenido para VR requiere muchísimo trabajo y espera que las herramientas de generación de modelos 3D sean un impulsor clave del metaverso
Otro usuario más evalúa que todos los servicios recientes que convierten texto/imágenes en modelos 3D han producido resultados inútiles
Un usuario menciona que es muy impresionante ejecutar todo el sistema usando un pipeline de texturizado PBR
Otro usuario comenta que se nota que la topología no es buena por la falta de wireframe
Un usuario piensa que este es otro paso pionero para recrear digitalmente la realidad
Otro usuario espera que pronto sea posible una conversión simple de 3D a 3D
Un usuario imagina que, con la intervención de un artista, los modelos generados podrían editarse después o usarse como punto de partida
Considera que Meta 3D Gen representa un avance importante en la generación de contenido 3D para aplicaciones de VR
Por último, un usuario dice que le gustaría ver una técnica alternativa a la reconstrucción de superficies Screened Poisson usando redes neuronales