1 puntos por GN⁺ 2023-12-29 | 1 comentarios | Compartir por WhatsApp

The New York Times demanda a OpenAI por derechos de autor

  • The New York Times presentó una demanda por infracción de derechos de autor contra OpenAI y su socio Microsoft.
  • Presentó evidencia de que los sistemas basados en GPT desarrollados por OpenAI pueden reproducir artículos de The New York Times.
  • The New York Times decidió demandar a OpenAI por el tema de licencias después de que las negociaciones no avanzaran bien.

El periodismo cuesta mucho

  • The New York Times incurre en grandes gastos para realizar periodismo de investigación importante a través de reporteros de distintas áreas.
  • El periódico genera ingresos mediante un sólido muro de pago y restringe el uso de sus obras mediante avisos de derechos de autor y términos de uso.
  • En la demanda se afirma que las herramientas desarrolladas por OpenAI están afectando ese modelo de ingresos.

No solo el entrenamiento

  • Se han presentado varias demandas por el uso de material con derechos de autor para entrenar sistemas de IA.
  • La demanda de The New York Times muestra cómo el material absorbido durante el entrenamiento puede reaparecer durante el uso.
  • La demanda incluye casos en los que GPT-4 reproduce casi textualmente artículos de The New York Times.

Reputación y otros daños

  • La demanda señala que las "alucinaciones" de la IA pueden dañar la reputación de The New York Times y afectar negativamente la salud de las personas.
  • También se alega que, en artículos de Wirecutter propiedad de The New York Times, se usó contenido protegido sin autorización y se eliminaron enlaces de monetización.
  • La demanda sostiene reclamaciones contra OpenAI y Microsoft por infracción de derechos de autor, violaciones de la DMCA y de marcas registradas, entre otras.

Opinión de GN⁺:

  • Este artículo muestra bien los problemas que surgen cuando el avance de la tecnología de IA entra en conflicto con marcos legales existentes como los derechos de autor.
  • La tensión entre los titulares de derechos de autor y los desarrolladores de IA podría detonar debates legales y éticos importantes sobre el futuro de la IA.
  • Que un gran medio como The New York Times tome acciones legales contra la tecnología de IA podría sentar un precedente importante para establecer regulaciones y lineamientos sobre cómo la IA genera y distribuye contenido.

1 comentarios

 
GN⁺ 2023-12-29
Opiniones de Hacker News
  • Pregunta sobre si hacer scraping de artículos del New York Times (NYT) para crear un producto constituye uso justo

    • Se plantea la duda de si, legalmente, crear un producto usando artículos del NYT obtenidos mediante scraping, resumirlos y reescribirlos para ofrecerlos de forma pagada constituye uso justo.
    • Se menciona la diferencia con los motores de búsqueda: mientras estos no sustituyen al original y solo proporcionan referencias, un producto de resúmenes podría usarse en lugar de una suscripción al NYT.
  • Perspectivas sobre la demanda por derechos de autor del NYT

    • Se afirma que la próxima generación de LLM (modelos de lenguaje a gran escala) será entrenada únicamente con datos "sintéticos" sin copyright, por lo que no tendría problemas de infracción.
    • Se opina que Estados Unidos no podrá frenar este avance tecnológico y que otros países tomarán la delantera.
    • Se plantea que, debido a la compleja evolución de los modelos de IA y a la falta de claridad sobre el origen de los datos, será difícil que la ley de copyright logre ponerse al día.
  • Evaluación sobre la copia de obras del NYT por parte de ChatGPT/Bing Copilot

    • Se considera que los casos en que ChatGPT y Bing Copilot copian artículos del NYT textualmente no califican como uso justo.
    • Se señala que la demanda no solo trata de la simple copia, sino también de que la copia no autorizada de artículos para entrenar LLM constituiría una infracción de copyright.
    • Se opina que el foco debería estar en la cuestión legal de si el modelo puede considerarse “transformativo”.
  • Preocupaciones sobre el “uso justo” planteadas en la demanda

    • Se expresa preocupación por el riesgo de que unas pocas empresas monopolicen el valor de internet.
    • Se espera que los tribunales establezcan reglas para este ámbito.
  • Enlace a los documentos de la demanda por copyright del NYT y resumen de su contenido

    • Se comparte un enlace a documentos que muestran claramente casos en los que ChatGPT cita textualmente material con copyright.
    • Se plantea la pregunta de cuánto debe transformarse un material protegido para que deje de aplicarse el copyright.
    • Se discute si OpenAI podría bloquear, mediante la interfaz web, la filtración de material con copyright.
  • Crítica a la percepción de algunos desarrolladores de que los LLM son similares a los humanos

    • Se critica la idea de algunos desarrolladores de que los LLM usan artículos del NYT como material educativo de la misma forma que lo haría una persona.
    • Se señala que el hecho de que un LLM sea complejo no cambia que contenido protegido por copyright haya sido incorporado al código fuente.
  • Expectativas de monetización de las empresas de contenido

    • Se menciona que empresas de contenido, incluido el NYT, esperan cobrar por el uso de su contenido en el entrenamiento de LLM.
    • Se indica que Reddit, Discord y Twitter están considerando vender contenido para entrenamiento de IA o ya lo están haciendo.
  • Argumento legal del NYT sobre el uso de LLM

    • Se analiza la postura del NYT de que la forma en que se usa su contenido para entrenar LLM constituye una infracción de copyright.
    • Se compara la crítica a que grandes empresas vendan acceso a LLM con una actitud más tolerante hacia usos personales o de investigación académica.
  • Predicciones sobre el uso futuro de los LLM

    • Se sostiene que, en el futuro, cuando los LLM se integren en máquinas que interactúen con el mundo físico, leer material con copyright terminará siendo ilegal.
    • Se plantea la visión de que los robots no podrán recordar contenido protegido por copyright obtenido al ver TV, leer libros de biblioteca o navegar por internet.
  • Opinión de que los LLM deberían considerarse uso justo como “obra transformativa”

    • Se expresa la opinión personal de que los LLM deberían calificar como uso justo por ser una obra transformativa.
    • Se manifiesta interés en ver qué decisión tomará el sistema legal al respecto.