warc-parquet - CLI para convertir WARC a Parquet (github.com/maxcountryman) 8 puntos por xguru 2022-06-30 | 1 comentarios | Compartir por WhatsApp Convierte archivos Web ARChive (.warc) al formato columnar Apache Parquet Puedes cargar Parquet en DuckDB y hacer consultas cómodamente Open source en Rust Lecturas relacionadas WarcDB - Datos de rastreo web como base de datos SQLite 14 puntos · 0 comentarios · 2022-06-22 Carquet - Biblioteca pura en C de alto rendimiento para leer y escribir archivos Parquet 9 puntos · 0 comentarios · 2026-01-17 dir2md v1.0.4 — actualización importante del CLI que convierte codebases open source a Markdown compatible con LLM 8 puntos · 0 comentarios · 2025-10-10 Broot - una nueva herramienta CLI para navegar árboles de directorios complejos 7 puntos · 3 comentarios · 2020-01-10 DuckLake - formato unificado de data lake y catálogo 13 puntos · 1 comentarios · 2025-05-29 1 comentarios xguru 2022-06-30 DuckDB - Base de datos OLAP embebida de código abierto Se parece a WarcDB - Datos de rastreo web como base de datos SQLite, que subieron hace poco. Pero en lugares donde ya existe infraestructura que usa Parquet, parece que será más fácil de usar.
1 comentarios
DuckDB - Base de datos OLAP embebida de código abierto
Se parece a WarcDB - Datos de rastreo web como base de datos SQLite, que subieron hace poco.
Pero en lugares donde ya existe infraestructura que usa Parquet, parece que será más fácil de usar.