- Herramienta de código abierto que usa OpenAI GPT-4o para generar datasets realistas de forma conversacional y ofrece en un solo flujo vista previa, exportación a CSV/SQL e integración con Metabase
- Constructor de prompts conversacional para configurar de forma intuitiva el tipo de negocio, el esquema, la cantidad de filas, etc.
- Soporta vista previa en el navegador en tiempo real
- Se puede exportar como CSV (archivo único o Zip con múltiples tablas) o como sentencias SQL Insert
- Permite ejecutar Metabase con un clic para explorar los datos
- Stack tecnológico: Next.js + Tailwind CSS + ShadCN UI + OpenAI API + Metabase
- La OpenAI API (aprox. $0.05) solo se usa al generar la vista previa o la especificación; la descarga/análisis de datos se genera gratis de forma local con Faker — garantiza tanto la privacidad de los datos como el costo
- Al previsualizar el dataset, usa OpenAI para generar una especificación detallada de los datos (esquema, reglas de negocio, lógica de eventos) según el tipo de negocio y los parámetros seleccionados
- Todas las filas reales de datos se generan localmente con Faker con base en la especificación creada por el LLM
- Al descargar o exportar los datos, ya no es necesario volver a llamar a OpenAI
- Opciones de esquema
- One Big Table (OBT): una sola tabla desnormalizada con todas las columnas relacionadas
- Star Schema: múltiples tablas para análisis avanzados (hechos + dimensiones). La estructura se determina según la especificación del LLM, y el generador produce todas las tablas localmente
1 comentarios
Parece que sería bastante útil en la práctica. Da la impresión de que incluso consideraron cuidadosamente el tema de los costos.