- Procesamiento de datos con índice nominal como CSV, TSV y JSON tabular
→ Ofrece funciones de awk, sed, cut, join y sort para datos de clave-valor
- Útil para limpieza y reducción de datos, elaboración de estadísticas, DevOps, administración de sistemas, procesamiento de archivos de logs, conversión de formatos de archivo y posprocesamiento de consultas a BD
→ Un ayudante para procesar resultados de R, Pandas, SQL Output, etc.
-
Soporta streaming y se integra bien con Unix Pipe
-
Procesa los datos internamente con un Insertion-Ordered Hash Map
-
Código abierto: al principio estaba escrito en C y desde la versión 6.0 cambió a Go
2 comentarios
No es algo que use muy seguido, pero incluso usándolo de vez en cuando con el manual abierto al lado, ¡me parece mejor que cualquier otra herramienta que haya probado hasta ahora!
Está bueno. Cuando hay que procesar archivos CSV grandes de forma ad hoc, no había muchas herramientas adecuadas, y además esta parece fácil de usar.