Introducción a en.osm.town
- en.osm.town forma parte de una red social federada basada en Mastodon
- Es una comunidad independiente de la comunidad de OpenStreetMap y recibe financiamiento de la OpenStreetMap Foundation
- Estadísticas del servidor: 257 usuarios activos
Puntos principales
- Grant Slater propone a las empresas de IA que, en lugar de hacer scraping oculto de los datos de OpenStreetMap, donen $10,000
- Con una donación de $50,000, incluso sería posible ofrecer actualizaciones en streaming en tiempo real
- Bart Louwers menciona que el scraping de OpenStreetMap es algo común
- wikiyu sostiene que usar los datos de
planet.osm es más eficiente
- Josua critica que la IA se está entrenando de formas ineficientes
- Juan Luis menciona que en Read the Docs también está ocurriendo un problema similar de abuso por parte de rastreadores de IA
- Simon Poole afirma que una solución razonable podría dañar la imagen de las empresas de IA
- Michał plantea la posibilidad de que a contratistas de ciertos países se les haya asignado la tarea de descargar datos de OSM
- leadingzero critica que los requisitos de la licencia de OSM no se están haciendo cumplir adecuadamente
- Grant Slater menciona que creó un repositorio en GitHub para rastrear atributos de tiles
- Guillaume Rischard menciona que recientemente resolvió un problema legal en Alemania
- Adderall girl grindset (Jes) propone bloquear a los rastreadores de IA
Resumen de GN⁺
- Este artículo aborda el problema de las empresas de IA que hacen scraping de datos de OpenStreetMap
- Propone formas más eficientes de usar los datos de OpenStreetMap y un enfoque de acceso a los datos mediante donaciones
- Se discute el problema del abuso por parte de rastreadores de IA y posibles medidas de respuesta
- Proyectos con funciones similares incluyen Google Maps y Bing Maps
1 comentarios
Opiniones de Hacker News
robots.txt, no usan APIs públicas y no respetan la carga pico, lo que aumenta los costos de infraestructuradocker runplanet.osma torrent y se permite el scraping solo a través de torrent, se puede distribuir la carga de red