4 puntos por xguru 2020-01-02 | 2 comentarios | Compartir por WhatsApp

Herramienta CLI que permite usar archivos CSV como si fueran una base de datos. Open source en Rust

Unir archivos, contar líneas, crear ancho fijo, reformatear (cambiar delimitadores, etc.),

join (inner, outer, cross), particionamiento por valores de columna, muestreo, orden inverso, extracción de columnas específicas, reordenamiento de columnas,

sort, división (en N archivos), stats (promedio, varianza, mediana, rango, etc. por cada columna), visualización en formato de tabla

2 comentarios

 
iolothebard 2020-01-02

¿spark en local?!

 
xguru 2020-01-02

Parece útil para limpiar datos CSV al hacer análisis de datos.

Ejemplo de cómo hacer joins al estilo SQL: https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/