SQL práctico para análisis de datos
(hakibenita.com)Ejemplos de análisis de datos con SQL en lugar de Pandas
-
Comparación de rendimiento/memoria entre SQL y Pandas
-
Conceptos básicos
→ Common Table Expressions
→ Generación de datos
→ Generación aleatoria
→ Selección aleatoria
→ Muestreo
-
Estadística descriptiva
-
Creación de subtotales: Rollup, Cube, agrupación
-
Agregación acumulada: funciones de ventana, Sliding Window
-
Regresión lineal
-
Interpolación
-
Binning
1 comentarios
Más que reemplazar todo el análisis de datos, parece que conviene verlo como una forma de preprocesar con SQL para reducir los datos y hacer más liviano a Pandas, que consume mucha memoria.