8 puntos por xguru 2022-06-30 | 1 comentarios | Compartir por WhatsApp
  • Convierte archivos Web ARChive (.warc) al formato columnar Apache Parquet
  • Puedes cargar Parquet en DuckDB y hacer consultas cómodamente
  • Open source en Rust

1 comentarios

 
xguru 2022-06-30

DuckDB - Base de datos OLAP embebida de código abierto

Se parece a WarcDB - Datos de rastreo web como base de datos SQLite, que subieron hace poco.
Pero en lugares donde ya existe infraestructura que usa Parquet, parece que será más fácil de usar.