The New York Times demanda a OpenAI y Microsoft por presunta infracción de derechos de autor

(theverge.com)

3 puntos por GN⁺ 2023-12-28 | 2 comentarios | Compartir por WhatsApp

The New York Times demandó a OpenAI y Microsoft por presunta infracción de derechos de autor
Afirma que estas empresas copiaron millones de artículos de The New York Times para entrenar modelos de lenguaje que impulsan ChatGPT y Copilot
Sostiene que esto dañó la relación de The New York Times con sus lectores y redujo sus ingresos por suscripciones, licencias, publicidad y afiliaciones

Alegatos de la demanda

Según la demanda, estos modelos de IA citan textualmente contenido de The New York Times, lo resumen y hasta imitan su estilo de redacción, lo que pone en riesgo el periodismo de alta calidad
The New York Times afirma que intentó negociar durante varios meses, pero no logró llegar a una solución
Un portavoz de OpenAI dijo que están trabajando para que los creadores de contenido puedan beneficiarse de la tecnología de IA y de nuevos modelos de ingresos

Noticias relacionadas

The New York Times bloqueó el rastreador web de OpenAI para impedir que siguiera extrayendo contenido de su sitio
Otros medios como BBC, CNN y Reuters también bloquearon el rastreador web de OpenAI
En cambio, Axel Springer firmó un acuerdo con OpenAI para que ChatGPT pueda usar directamente información de Politico y Business Insider

Opinión de GN⁺

Este caso refleja un tema contemporáneo en el que chocan el avance de la tecnología de IA y los problemas de derechos de autor.
La demanda por infracción de derechos de autor puede desencadenar un importante debate legal y ético sobre cómo la IA debe utilizar las obras creadas por humanos.
Que un gran medio como The New York Times enfrente a empresas de IA podría convertirse en un punto de inflexión decisivo para el futuro de la tecnología de IA y la protección de los derechos de los creadores de contenido.

2 comentarios

xguru 2023-12-29

Según otro artículo, la demanda exige la eliminación de todas las instancias de GPT entrenadas con material de The New York Times y la destrucción de los conjuntos de datos usados para el entrenamiento. También solicita una orden judicial permanente para evitar actos similares en el futuro.
Además, incluye una exigencia de costos enormes: "daños legales, daños compensatorios, restitución, daños punitivos y cualquier otra reparación que pueda estar permitida por la ley o por principios de equidad"

GN⁺ 2023-12-28

Opiniones en Hacker News

Postura de apoyo al New York Times (NYT)
- Parece que las organizaciones creativas están quedando rezagadas en la competencia una vez más, tal como ocurrió con el surgimiento de los motores de búsqueda modernos.
- No critico la decisión inicial de OpenAI de entrenar modelos sin acuerdos de licencia. Si no lo hubiera hecho, quizá la revolución de la IA no habría ocurrido.
- Pero ahora OpenAI debe reconocer lo que les debe a los creadores de contenido y corregirlo. De lo contrario, podría sufrir pérdidas mayores y dar oportunidades a la competencia.
Sentimientos encontrados sobre los LLM que consumen contenido con copyright y lo reproducen como algo nuevo
- Como desarrollador de software y autor, el avance de los LLM es interesante, pero me preocupa que mis obras hayan sido usadas por los LLM.
- Actualmente, los LLM se parecen a sitios web de baja calidad que reescriben contenido sin investigación original. Técnicamente eso puede ser legal, pero es una conducta parasitaria que no aporta valor.
- Para los expertos, los errores y la falta de citas en los LLM son un problema, y la gente común los usará para generar contenido de bajo esfuerzo orientado al SEO, lo que podría terminar degradando la calidad de los propios LLM.
Esperanza de una ampliación del uso justo para el entrenamiento de IA
- El uso justo para entrenar IA es más importante para el futuro de la humanidad que un solo medio de comunicación.
- Aunque el NYT desapareciera, habría muchos medios que podrían reemplazarlo, pero si la IA se ve dañada en una etapa temprana por disputas de propiedad intelectual (PI), eso podría frenar avances importantes.
Argumento débil sobre la imitación del estilo del New York Times y perspectiva negativa para OpenAI
- Que OpenAI reproduzca tal cual el contenido del New York Times juega en su contra.
- Es difícil eliminar contenido específico de un LLM, y eso sugiere que la vida útil de los LLM será corta.
Bloquear a los LLM con base en infracción de copyright no promueve el progreso de la ciencia y las artes útiles
- Los LLM necesitan regulación, pero debe ser otro tipo de regulación, no basada en copyright.
- La idea inicial de apertura de OpenAI era buena, pero ahora hace falta intervención pública.
Crítica a que una sola empresa monopolice toda la producción humana
- Esta clase de conducta es, como mínimo, descarada y equivocada, y probablemente también vergonzosa.
- Como OpenAI tiene demasiadas víctimas, demandar resulta poco realista, así que es probable que los tribunales decidan de antemano no compensar a las víctimas.
Libre acceso al contenido publicado en internet y legitimidad del uso de datos por parte de las máquinas
- Si los humanos pueden acceder a un contenido, las máquinas también deberían poder hacerlo.
- Las máquinas pueden encargarse de tareas que los humanos pueden hacer, para que estos dediquen su tiempo a cosas más interesantes.
Conducta parasitaria de los LLM y comparación con los trolls de patentes
- Los LLM se entrenan aprovechando patrones lingüísticos de corpus de texto que los creadores no estaban usando.
- Eso no beneficia a la sociedad y solo favorece a los trolls. No hay razón para que los tribunales lo impongan.
Mención del caso en el que el New York Times demandó a OpenAI y Microsoft
- El New York Times afirma que copiaron y usaron millones de sus artículos para construir modelos de IA.