LegoGPT - generación automática de diseños LEGO realmente ensamblables a partir de texto
(avalovelace1.github.io)- LegoGPT es un proyecto innovador que genera estructuras LEGO estables y realmente ensamblables usando solo texto como entrada
- Construyó el dataset StableText2Lego, que ofrece más de 47,000 estructuras LEGO físicamente estables y descripciones detalladas
- El algoritmo aplica validación rápida y rollback basado en física para eliminar automáticamente estructuras irreales
- Los diseños LEGO generados pueden ser ensamblados en la práctica tanto por personas como por robots, e incluso admiten diversas expresiones de color y textura
- Este sistema abre nuevas posibilidades en áreas como prototipado de diseño creativo, educación y aplicaciones de robótica
Introducción al proyecto
- LegoGPT es el primer enfoque que genera, de manera completamente automatizada y a partir de prompts de texto ingresados por el usuario, estructuras LEGO realmente ensamblables y físicamente estables
- El proyecto fue construido con un dataset de estructuras LEGO a gran escala y descripciones detalladas, y produce resultados con estabilidad, diversidad y calidad estética incluso en el proceso de ensamblaje real
- Se verificó experimentalmente que los resultados de generación de estructuras LEGO pueden ser ensamblados manualmente por personas o de forma automática con un brazo robótico
Dataset StableText2Lego
- El dataset StableText2Lego voxeliza formas a partir de mallas 3D de ShapeNetCore y aplica diversos métodos de colocación de bricks para adoptar solo estructuras que pasan la verificación de estabilidad física
- Durante el proceso de generación de datos, para cada estructura se renderizan vistas desde 24 ángulos, y con base en ellas GPT-4o genera automáticamente descripciones detalladas
- El dataset así construido incluye más de 47,000 estructuras LEGO con formas, estructuras y texturas diversas, así como más de 28,000 objetos 3D únicos
Pipeline de LegoGPT
- Las estructuras LEGO se tokenizan como secuencias de texto de abajo hacia arriba, con un método de raster-scan
- Al emparejar cada secuencia de bricks con una descripción en lenguaje natural, se realiza ajuste fino sobre un modelo basado en LLaMA-3.2-Instruct-1B para aprender el mapeo entre descripción y secuencia de bricks
- En la etapa de inferencia, LegoGPT genera la estructura LEGO de forma progresiva para un prompt de texto prediciendo y agregando bricks uno por uno
- Cada vez que se agrega un brick, se realiza una validación sobre formato, existencia en la biblioteca de bricks y colisiones, y tras generar toda la estructura se revalida la estabilidad física
- Si la estructura final es inestable, se eliminan tanto el brick inestable como todos los bricks añadidos después, y se hace rollback hasta un estado estable para regenerarla
Ejemplos de generación paso a paso de estructuras LEGO
- "Un bote esbelto con casco largo y angosto"
- "Un librero con repisas horizontales"
- "Una banca con reposabrazos y sin respaldo"
- Cada ejemplo se genera paso a paso desde un prompt de texto hasta una estructura LEGO que refleja claramente sus rasgos visuales
Ensamblaje automático con robots
- Los modelos LEGO generados se aplicaron al ensamblaje real con un brazo robótico y se mostraron en una demostración en video a 8x de velocidad
- Muestran la viabilidad real de ensamblaje robótico en casos como "Un bote esbelto con casco largo y angosto" y "Una guitarra asimétrica de 6 cuerdas"
Modelos LEGO generados con textura y color
- A partir de prompts en lenguaje natural como "Una banca cubierta de musgo", "Material cyberpunk con gradiente neón" o "Estantería de estudio victoriano", ofrece diseños LEGO capaces de expresar textura, material y efectos estéticos específicos
- También permite diseños LEGO que reflejan solo con texto colores variados y efectos metálicos, como en "Sunburst Les Paul with amber finish"
Citas y apoyo a la investigación
- Se indican la información del paper, los autores y las instituciones que apoyaron esta investigación (por ejemplo, Packard Foundation, Amazon Faculty Award, etc.)
- Es un proyecto desarrollado con diversos apoyos académicos e industriales, como la Microsoft Research PhD Fellowship de uno de los investigadores principales
Referencias del proyecto y plantilla
- La plantilla del sitio toma como referencia y aprovecha el diseño de los proyectos Custom Diffusion y DreamFusion
1 comentarios
Comentarios de Hacker News
playsinlineen la etiquetavideohttps://developer.mozilla.org/en-US/docs/…. Es una pena que iOS tenga este comportamiento por defecto