1 puntos por GN⁺ 2023-08-26 | 1 comentarios | Compartir por WhatsApp
  • Un artículo sobre la complejidad legal y la hipocresía en torno al web scraping
  • Cómo grandes empresas como Meta y Microsoft prohíben el web scraping en sus propias plataformas mientras al mismo tiempo recopilan datos de las plataformas de otras compañías
  • La complejidad de las cuestiones legales sobre el acceso y uso de datos en Internet, y del propósito de ese acceso. Existen formas de datos protegidas por derechos de autor u otra propiedad intelectual, pero la mayor parte de los datos en Internet no puede protegerse fácilmente
  • Las empresas de redes sociales como LinkedIn y Facebook son las que persiguen con más agresividad las demandas contra el web scraping. Sin embargo, el contenido que intentan proteger fue generado por los usuarios y no es propiedad de ellas mismas
  • En los primeros años de Internet, las empresas usaron teorías legales para detener el web scraping como si fuera una intrusión sobre bienes materiales; es decir, argumentaban que las solicitudes masivas de datos no deseadas constituían una forma de invasión a la propiedad tangible de una persona, concretamente a los servidores informáticos
  • Desde principios de los 2000 hasta 2017, la Computer Fraud and Abuse Act (CFAA) fue la principal teoría legal para impedir el web scraping. La CFAA prohíbe el acceso no autorizado a una "computadora protegida"
  • En el caso de 2017 hiQ Labs, Inc. v. LinkedIn Corp., se confirmó el derecho de los web scrapers a acceder a datos públicos de LinkedIn bajo la CFAA, y muchos empezaron a interpretarlo como un derecho afirmativo a hacer scraping de datos públicos
  • Actualmente, la principal forma de detener el web scraping es alegar incumplimiento contractual. Esto permite a las empresas reclamar derechos de propiedad sobre el uso y acceso a los datos mediante el derecho contractual
  • El cambio del derecho de propiedad al derecho contractual permite a los dueños de sitios web definir derechos sobre los datos en línea mediante términos de uso en línea
  • El artículo destaca la hipocresía de empresas como Microsoft. Recientemente actualizó sus términos de uso para prohibir el scraping de servicios de IA, pero su afiliada OpenAI lanzó un producto diseñado para hacer scraping de todo Internet
  • El autor critica que los tribunales permitan a empresas privadas crear derechos de propiedad intelectual mediante contratos de adhesión, y sostiene que estas decisiones deberían tratarse como cuestiones de interés público
  • El artículo sugiere que el régimen legal actual sobre el web scraping será puesto a prueba por el caso de la IA generativa, y predice que la coherencia del derecho no podrá mantenerse y que habrá importantes avances legales en los próximos años

1 comentarios

 
GN⁺ 2023-08-26
Opiniones de Hacker News
  • La reciente competencia en IA y LLM ha incrementado la preocupación por el web scraping, y figuras y empresas tecnológicas importantes están reforzando sus defensas ante la amenaza percibida.
  • Para aliviar el temor en torno al scraping de datos, se necesita una nueva interpretación del copyright para las aplicaciones comerciales de IA.
  • El caso HiQ vs. LinkedIn se cita con frecuencia en las discusiones sobre web scraping, pero los detalles del caso son complejos y a menudo se pasan por alto.
  • La aparente hipocresía de las empresas que extraen datos mientras prohíben que extraigan los suyos puede entenderse como una estrategia competitiva, y no como una contradicción.
  • El cambio del derecho de propiedad al derecho contractual permitió que los dueños de sitios web definieran sus propios derechos, lo que llevó a la proliferación de "contratos" unilaterales por parte de grandes empresas.
  • El caso reciente de Microsoft, que prohibió el scraping mientras lanzaba un producto diseñado para scrapear internet, fue señalado como un ejemplo de hipocresía corporativa.
  • El web scraping se considera un problema de modelo de negocio, especialmente por la escala, y los proveedores de contenido gratuito que dependen de ingresos publicitarios se ven amenazados por el scraping que evade los anuncios.
  • La propiedad del contenido generado por usuarios en plataformas como Facebook es compleja, y los usuarios conservan la propiedad mientras otorgan a la plataforma amplios derechos de uso.
  • Los obstáculos legales al web scraping suelen considerarse perjudiciales, pero también hay personas que han sufrido efectos negativos por el scraping, como el correo no deseado.