16 puntos por GN⁺ 2025-05-04 | 2 comentarios | Compartir por WhatsApp
  • La extensión geoespacial de DuckDB reduce de forma drástica la barrera de acceso a los datos geoespaciales con una interfaz simple basada en SQL
  • Gracias a esto, incluso analistas de datos generales pueden hacer análisis geoespacial con dos líneas de código
  • Desde finales de 2023, el interés de búsqueda por "geospatial" se disparó, en coincidencia con el lanzamiento de la extensión de DuckDB
  • También se analiza que la expansión de proyectos geoespaciales recientes como Overture Maps refleja la influencia de DuckDB
  • El equipo de DuckDB resolvió internamente las dependencias complejas y la integración de herramientas GIS para simplificar la experiencia de usuario

Cómo DuckDB cambió el campo geoespacial

  • El autor asistió recientemente a la Cloud-Native Geospatial Conference 2025, donde se discutió la democratización de los datos geoespaciales
  • La pregunta central fue cómo llevar los datos geoespaciales a más industrias, y DuckDB estuvo en el centro de esa conversación
  • Hasta finales de 2023, el volumen de búsquedas de la palabra clave "geospatial" se había mantenido estancado, pero tras el lanzamiento de la extensión geoespacial de DuckDB subió con fuerza
  • Como prueba de la influencia de DuckDB, en Google Trends también se observa una tendencia al alza conjunta de las palabras clave DuckDB y geospatial
  • Por supuesto, no se puede afirmar una relación causal, pero el autor considera significativa esa correlación

Análisis geoespacial posible con solo dos líneas

install spatial;   
load spatial;  
  • Antes era necesario instalar o compilar numerosos paquetes y además configurar una base de datos por separado
  • En cambio, DuckDB completa el entorno de análisis geoespacial con una sola interfaz SQL
  • Como resultado, cualquier persona que sepa usar SQL puede acceder fácilmente, y también se reduce la carga sobre la infraestructura de TI

¿Overture Maps también gracias a DuckDB?

  • El autor se pregunta si la adopción exitosa de la Overture Maps Foundation habría sido posible sin DuckDB
  • Supone que, sin DuckDB, la barrera de entrada inicial para trabajar con datos geoespaciales habría sido demasiado alta

Debate adicional en Hacker News

  • Max, desarrollador de DuckDB, destacó que se agruparon internamente herramientas GIS FOSS como PROJ DB, GDAL y QGIS para eliminar dependencias
  • Gracias a eso, puede usarse en diversas plataformas como WASM sin procesos de instalación complejos
  • Además, integra funciones de alto rendimiento como ejecución vectorizada fuera de memoria y almacenamiento comprimido por columnas
  • Recientemente, también se incorporaron a la rama dev un nuevo motor de geometría y funciones de optimización de spatial join

Conclusión

  • DuckDB elimina los problemas de instalación y conexión de herramientas geoespaciales complejas y lo ofrece todo junto con SQL
  • Por ello, se le considera un software que ha contribuido de forma decisiva a la democratización de los datos geoespaciales

2 comentarios

 
zihado 2025-05-05

DuckDB está en racha.

 
GN⁺ 2025-05-04
Opiniones de Hacker News
  • Me gusta DuckDB y hago principalmente análisis geoespacial. Normalmente divido áreas geográficas con hexágonos Uber H3, calculo distancias Haversine, calculo áreas geométricas y determino a qué geometría pertenece un punto. Estas funciones ya existían en geopandas o postgis, así que la extensión espacial de DuckDB no aporta nada nuevo

    • Sin embargo, el motor de DuckDB permite trabajar directamente con archivos parquet/geoparquet a gran escala en un escritorio local. En eso supera a geopandas. Ha mejorado mi calidad de vida
    • DuckDB tiene una arquitectura de extensiones que permite funciones geoespaciales peculiares, como la curva de Hilbert y soporte para Uber H3
  • Antes había que instalar o compilar varios paquetes de código abierto, registrar cuidadosamente las rutas y construir una base de datos especializada. Era una carga de trabajo que un generalista de datos quizá no intentaría o que el departamento de TI quizá no apoyaría

    • He usado CREATE EXTENSION postgis; por más de 10 años. PG, MySQL, Oracle, MS SQL Server y SQLite han tenido extensiones espaciales desde hace mucho. DuckDB no marca una diferencia real en la facilidad de instalación
  • También existe import geopandas, y se ha usado desde hace bastante tiempo. Dejando de lado el sarcasmo, me pregunto qué tiene DuckDB de especial. Si el autor hubiera mostrado ejemplos reales, habría sido más fácil entender su argumento

  • El software que más me entusiasma para trabajar en apps geoespaciales es Felt. Espero que amplíen sus herramientas para que los desarrolladores puedan controlar la autenticación/autorización de mapas y fuentes de datos, permitiendo aislamiento por tenant y acceso a datos propietarios. Eso podría revolucionar cómo la tecnología geoespacial se integra en apps de consumo

    • Este artículo no reconoce lo de nicho que es todo esto. Hace falta mucha educación sobre sistemas de coordenadas, proyecciones, transformaciones, etc. Si fuera posible, me gustaría reemplazar muchas herramientas de mapeo personalizadas con Felt. Eso permitiría enfocarse en los procesos geoespaciales centrales sin concentrarse en el código para mostrar y manipular cosas en el navegador. En términos de LOC que mantener, es casi lo mismo o incluso más
    • Como se mencionó en otro comentario, la DX de DuckDB descrita es básicamente igual a la de PostGIS
  • No creo que “instalar geospatial” sea un cambio de juego en simplicidad frente a pip install geopandas

    • Ambas son una sola línea
  • ¿Es mucho más simple que load extension postgis? GEOS y GDAL siempre fueron un poco engorrosos, pero siento que docker ya abstrajo todo eso. docker pull postgis es bastante fácil. No conozco bien qué más ofrece DuckDB

  • Dejo un comentario para promocionar un proyecto similar. Estoy trabajando en una extensión geoespacial para Polars. Aún no es estable (aunque ya falta poco), pero ya es casi completa en funciones (usa GEOS y PROJ como backend, así que está a la par de GeoPandas)

  • ¿Qué tan grande es el conjunto de datos? En la empresa queremos usar DuckDB para datos de transacciones y reportes financieros. El conjunto de datos son unos 500 GB de CSV en S3, y DuckDB no puede manejarlo

  • Me preocupa la licencia de DuckDB y GEOS. La primera tiene licencia MIT y la segunda LGPL 2.1

    • Esto crea una situación compleja donde algunos builds violan LGPL 2.1. Por ejemplo, el enlace estático con aplicaciones de código cerrado
  • DuckDB es excelente para geoespacial, pero ¿es lo más importante de los últimos 10 años? Hay muchas herramientas en distintas categorías, así que para mí no entra en los primeros lugares. Están QGIS, postGIS (que sigue siendo el estándar), ArcGIS Online (que sigue siendo el estándar), herramientas JS de mapeo como mapbox (prefiero deckgl), nuevos tipos de datos como COG, geopackage y geoparquet, herramientas de fotogrametría, mosaicos 3D, gdal y pdal, y bibliotecas base como shapely