Tribunal de apelaciones de EE. UU. vuelve a fallar que el web scraping es legal

xguru · 2022-04-20T09:50:04+09:00

"Hacer scraping de datos accesibles públicamente es legal (no viola la CFAA)" En la demanda presentada por LinkedIn para impedir el scraping de la firma de análisis Hiq, se reafirma el fallo anterior (ya había perdido en 2019) Buenas noticias para archivos web, el ámbito académico, investigadores y periodistas Esta vez, el tribunal estadounidense volvió a revisar la CFAA (Computer Fraud and Abuse Act, Ley de Fraude y Abuso Informático), con décadas de antigüedad Limitando esta infracción a quienes "obtuvieron acceso no autorizado" a un sistema informático El concepto de "no autorizado" no aplica a sitios web públicos

(techcrunch.com)

22 puntos por xguru 2022-04-20 | 11 comentarios | Compartir por WhatsApp

"Hacer scraping de datos accesibles públicamente es legal (no viola la CFAA)"
En la demanda presentada por LinkedIn para impedir el scraping de la firma de análisis Hiq, se reafirma el fallo anterior (ya había perdido en 2019)
Buenas noticias para archivos web, el ámbito académico, investigadores y periodistas
Esta vez, el tribunal estadounidense volvió a revisar la CFAA (Computer Fraud and Abuse Act, Ley de Fraude y Abuso Informático), con décadas de antigüedad
- Limitando esta infracción a quienes "obtuvieron acceso no autorizado" a un sistema informático
- El concepto de "no autorizado" no aplica a sitios web públicos

11 comentarios

devsejong 2022-04-20

También me pregunto si en Corea el web scraping no tiene problemas legales.
Si alguien tiene experiencia, ¿podría compartirla?

nullvana 2022-04-25

Según la regulación de nuestro país

Información crediticia personal
Esto no se refiere al "crédito" de la tarjeta de crédito. Está prohibido ofrecer un servicio que permita al propio titular "consultar" datos con los que se pueda evaluar su reputación financiera personal (saldo, historial de transacciones, etc.). Para eso hay que obtener la autorización como empresa de gestión de información crediticia personal. Pero si no se puede consultar por el propio titular y simplemente se usa como material, como en una declaración de impuestos, entonces no hay problema. Eh...?
Aunque obtengas la información que quieres mediante crawling o scraping en una página web, es ilegal si, por ejemplo, se evita la página de pago o se obtiene cualquier dato distinto de lo que se proporciona o pretende mostrar en pantalla. Aunque no se muestre en pantalla y vaya y venga entre el fe/be en json, usarlo fuera de su propósito previsto es ilegal. Creo haber visto en las noticias que alguien fue arrestado por sacar registros gratis desde el Ministerio de Justicia.

Bueno, el punto 2, como las entidades financieras sin dinero (seguros/tarjetas/casas de bolsa, etc... fuera de los bancos) no tienen capacidad suficiente y hay muchos huecos... desde el punto de vista de protección hasta lo entiendo... pero el punto 1 sí que parece una metida de pata enorme. También entiendo la intención del 1 dentro de la idea de soberanía de los datos personales, pero la forma en que lo están haciendo ahora parece ActiveX 3.0?

devsejong 2022-04-21

¡Muchas gracias a todos los que dejaron comentarios! Gracias a ustedes, me fue de gran ayuda.

ninebow 2022-04-21

Comparto un enlace de un boletín al que estoy suscrito, donde hace poco se trató un tema similar.

Junto con el caso de JobKorea vs. Saramin que mencionó rtyuiop más abajo, aquí también se resumen los casos de Yeogi Eottae vs. Yanolja y Naver vs. Darwin Brokerage.
https://stibee.com/api/v1.0/…==

xguru 2022-04-21

Qué buen boletín de Oh Packful News. ¡Gracias por el enlace~!

ninebow 2022-04-21

Siempre lo leo con mucho agradecimiento (_ _)

rtyuiop 2022-04-20

Hasta donde yo sé, el caso más conocido es el de Yeogieottae, que rastreó los datos de Yanolja. Según entiendo, por supuesto eran datos públicos y no había problema con el rastreo en sí, pero los temas principales eran (1) el daño que sufrió Yanolja por el aumento de carga en el servidor y (2) el posible perjuicio para Yanolja por tratarse de dos marcas del mismo sector. Como la demanda sigue en curso y cada artículo la interpreta de manera distinta, creo que lo mejor sería que lean directamente varias fuentes por su cuenta.

tingo29 2022-04-20

En el sector financiero, el scraping quedó prohibido desde el inicio de MyData.

https://news.einfomax.co.kr/news/articleView.html?idxno=4192027

tribela 2022-04-20

Hablé una vez de ese tema con un abogado que conozco, y en ese momento el criterio era: "en principio, no hay problema con recopilar información que ya es pública, pero si existe algún tipo de mecanismo para impedir el rastreo, en el momento en que intentas eludirlo para guardar esos datos, podría volverse un problema".
Al final, en la ley parece importar más la intención que los aspectos técnicos.

xguru 2022-04-20

Como se trata de información de perfiles personales que está en LinkedIn, se siente un poco delicado, pero... me parece que sí sería excesivo prohibir incluso el scraping de información que ya está disponible públicamente.

Panorama del web scraping en 2021

joone 2022-04-26

También hay mucha información pública en LinkedIn. Pero LinkedIn es uno de los sitios más difíciles de scrapear. Aun así, de alguna manera logran recopilar las páginas. Es una lucha entre la lanza y el escudo.

Tribunal de apelaciones de EE. UU. vuelve a fallar que el web scraping es legal

Lecturas relacionadas

11 comentarios