- Un artículo sobre la complejidad legal y la hipocresía en torno al web scraping
- Cómo grandes empresas como Meta y Microsoft prohíben el web scraping en sus propias plataformas mientras al mismo tiempo recopilan datos de las plataformas de otras compañías
- La complejidad de las cuestiones legales sobre el acceso y uso de datos en Internet, y del propósito de ese acceso. Existen formas de datos protegidas por derechos de autor u otra propiedad intelectual, pero la mayor parte de los datos en Internet no puede protegerse fácilmente
- Las empresas de redes sociales como LinkedIn y Facebook son las que persiguen con más agresividad las demandas contra el web scraping. Sin embargo, el contenido que intentan proteger fue generado por los usuarios y no es propiedad de ellas mismas
- En los primeros años de Internet, las empresas usaron teorías legales para detener el web scraping como si fuera una intrusión sobre bienes materiales; es decir, argumentaban que las solicitudes masivas de datos no deseadas constituían una forma de invasión a la propiedad tangible de una persona, concretamente a los servidores informáticos
- Desde principios de los 2000 hasta 2017, la Computer Fraud and Abuse Act (CFAA) fue la principal teoría legal para impedir el web scraping. La CFAA prohíbe el acceso no autorizado a una "computadora protegida"
- En el caso de 2017 hiQ Labs, Inc. v. LinkedIn Corp., se confirmó el derecho de los web scrapers a acceder a datos públicos de LinkedIn bajo la CFAA, y muchos empezaron a interpretarlo como un derecho afirmativo a hacer scraping de datos públicos
- Actualmente, la principal forma de detener el web scraping es alegar incumplimiento contractual. Esto permite a las empresas reclamar derechos de propiedad sobre el uso y acceso a los datos mediante el derecho contractual
- El cambio del derecho de propiedad al derecho contractual permite a los dueños de sitios web definir derechos sobre los datos en línea mediante términos de uso en línea
- El artículo destaca la hipocresía de empresas como Microsoft. Recientemente actualizó sus términos de uso para prohibir el scraping de servicios de IA, pero su afiliada OpenAI lanzó un producto diseñado para hacer scraping de todo Internet
- El autor critica que los tribunales permitan a empresas privadas crear derechos de propiedad intelectual mediante contratos de adhesión, y sostiene que estas decisiones deberían tratarse como cuestiones de interés público
- El artículo sugiere que el régimen legal actual sobre el web scraping será puesto a prueba por el caso de la IA generativa, y predice que la coherencia del derecho no podrá mantenerse y que habrá importantes avances legales en los próximos años
1 comentarios
Opiniones de Hacker News