- La extensión geoespacial de DuckDB reduce de forma drástica la barrera de acceso a los datos geoespaciales con una interfaz simple basada en SQL
- Gracias a esto, incluso analistas de datos generales pueden hacer análisis geoespacial con dos líneas de código
- Desde finales de 2023, el interés de búsqueda por "geospatial" se disparó, en coincidencia con el lanzamiento de la extensión de DuckDB
- También se analiza que la expansión de proyectos geoespaciales recientes como Overture Maps refleja la influencia de DuckDB
- El equipo de DuckDB resolvió internamente las dependencias complejas y la integración de herramientas GIS para simplificar la experiencia de usuario
Cómo DuckDB cambió el campo geoespacial
- El autor asistió recientemente a la Cloud-Native Geospatial Conference 2025, donde se discutió la democratización de los datos geoespaciales
- La pregunta central fue cómo llevar los datos geoespaciales a más industrias, y DuckDB estuvo en el centro de esa conversación
- Hasta finales de 2023, el volumen de búsquedas de la palabra clave "geospatial" se había mantenido estancado, pero tras el lanzamiento de la extensión geoespacial de DuckDB subió con fuerza
- Como prueba de la influencia de DuckDB, en Google Trends también se observa una tendencia al alza conjunta de las palabras clave DuckDB y geospatial
- Por supuesto, no se puede afirmar una relación causal, pero el autor considera significativa esa correlación
Análisis geoespacial posible con solo dos líneas
install spatial;
load spatial;
- Antes era necesario instalar o compilar numerosos paquetes y además configurar una base de datos por separado
- En cambio, DuckDB completa el entorno de análisis geoespacial con una sola interfaz SQL
- Como resultado, cualquier persona que sepa usar SQL puede acceder fácilmente, y también se reduce la carga sobre la infraestructura de TI
¿Overture Maps también gracias a DuckDB?
- El autor se pregunta si la adopción exitosa de la Overture Maps Foundation habría sido posible sin DuckDB
- Supone que, sin DuckDB, la barrera de entrada inicial para trabajar con datos geoespaciales habría sido demasiado alta
Debate adicional en Hacker News
- Max, desarrollador de DuckDB, destacó que se agruparon internamente herramientas GIS FOSS como PROJ DB, GDAL y QGIS para eliminar dependencias
- Gracias a eso, puede usarse en diversas plataformas como WASM sin procesos de instalación complejos
- Además, integra funciones de alto rendimiento como ejecución vectorizada fuera de memoria y almacenamiento comprimido por columnas
- Recientemente, también se incorporaron a la rama dev un nuevo motor de geometría y funciones de optimización de spatial join
Conclusión
- DuckDB elimina los problemas de instalación y conexión de herramientas geoespaciales complejas y lo ofrece todo junto con SQL
- Por ello, se le considera un software que ha contribuido de forma decisiva a la democratización de los datos geoespaciales
2 comentarios
DuckDB está en racha.
Opiniones de Hacker News
Me gusta DuckDB y hago principalmente análisis geoespacial. Normalmente divido áreas geográficas con hexágonos Uber H3, calculo distancias Haversine, calculo áreas geométricas y determino a qué geometría pertenece un punto. Estas funciones ya existían en geopandas o postgis, así que la extensión espacial de DuckDB no aporta nada nuevo
Antes había que instalar o compilar varios paquetes de código abierto, registrar cuidadosamente las rutas y construir una base de datos especializada. Era una carga de trabajo que un generalista de datos quizá no intentaría o que el departamento de TI quizá no apoyaría
CREATE EXTENSION postgis;por más de 10 años. PG, MySQL, Oracle, MS SQL Server y SQLite han tenido extensiones espaciales desde hace mucho. DuckDB no marca una diferencia real en la facilidad de instalaciónTambién existe
import geopandas, y se ha usado desde hace bastante tiempo. Dejando de lado el sarcasmo, me pregunto qué tiene DuckDB de especial. Si el autor hubiera mostrado ejemplos reales, habría sido más fácil entender su argumentoEl software que más me entusiasma para trabajar en apps geoespaciales es Felt. Espero que amplíen sus herramientas para que los desarrolladores puedan controlar la autenticación/autorización de mapas y fuentes de datos, permitiendo aislamiento por tenant y acceso a datos propietarios. Eso podría revolucionar cómo la tecnología geoespacial se integra en apps de consumo
No creo que “instalar geospatial” sea un cambio de juego en simplicidad frente a
pip install geopandas¿Es mucho más simple que
load extension postgis? GEOS y GDAL siempre fueron un poco engorrosos, pero siento que docker ya abstrajo todo eso.docker pull postgises bastante fácil. No conozco bien qué más ofrece DuckDBDejo un comentario para promocionar un proyecto similar. Estoy trabajando en una extensión geoespacial para Polars. Aún no es estable (aunque ya falta poco), pero ya es casi completa en funciones (usa GEOS y PROJ como backend, así que está a la par de GeoPandas)
¿Qué tan grande es el conjunto de datos? En la empresa queremos usar DuckDB para datos de transacciones y reportes financieros. El conjunto de datos son unos 500 GB de CSV en S3, y DuckDB no puede manejarlo
Me preocupa la licencia de DuckDB y GEOS. La primera tiene licencia MIT y la segunda LGPL 2.1
DuckDB es excelente para geoespacial, pero ¿es lo más importante de los últimos 10 años? Hay muchas herramientas en distintas categorías, así que para mí no entra en los primeros lugares. Están QGIS, postGIS (que sigue siendo el estándar), ArcGIS Online (que sigue siendo el estándar), herramientas JS de mapeo como mapbox (prefiero deckgl), nuevos tipos de datos como COG, geopackage y geoparquet, herramientas de fotogrametría, mosaicos 3D, gdal y pdal, y bibliotecas base como shapely