2 puntos por GN⁺ 2025-05-13 | 1 comentarios | Compartir por WhatsApp
  • La Oficina de Copyright de EE. UU. reconoció oficialmente recientemente casos de infracción de copyright por parte de empresas de IA
  • Señaló que los algoritmos de IA usan enormes volúmenes de material con copyright y que se requiere consentimiento y compensación para los creadores
  • El informe concluye que en algunas situaciones la defensa de fair use no se sostiene
  • Empresas clave como OpenAI, Google, Meta y Microsoft están enfrentando demandas por este tema
  • La situación se vuelve más compleja por la coincidencia entre políticas favorables a la IA y destituciones de funcionarios por motivos políticos

Panorama del informe de la Oficina de Copyright de EE. UU. y la destitución de su directora

  • La directora de la Oficina de Copyright de EE. UU. fue destituida justo después de que un informe concluyera que las empresas que desarrollan modelos de IA excedieron los límites tradicionales del fair use al utilizar material con copyright
  • Este informe forma parte del tercer borrador de reporte sobre copyright e IA
  • El primer informe trató el problema de la reproducción digital, y el segundo examinó la posibilidad de copyright para resultados de IA generativa

Puntos principales del borrador del informe

  • El 9 de mayo se publicó un borrador de informe (PDF) sobre el uso de obras en el desarrollo de sistemas de IA generativa
  • Quedó claramente expuesto que los sistemas de IA usan enormes volúmenes de datos, es decir, material con copyright
  • Se plantea la pregunta de si la IA debe obtener consentimiento o compensación de los titulares de derechos
  • Este es de hecho el punto central de múltiples demandas
  • Las empresas desarrolladoras de IA han admitido que entrenaron sus productos con contenido tomado de internet y otras fuentes sin autorización

Jurisprudencia sobre fair use y criterios de evaluación

  • Las empresas de IA sostienen que no hay problema legal basándose en la cláusula de fair use de la ley de copyright
  • Sin embargo, los jueces han enfatizado que el criterio para evaluar el fair use es si afecta “el mercado potencial o el valor de la obra original”
  • Si el impacto no es significativo, entonces puede considerarse fair use
  • El informe indica explícitamente que en ciertas situaciones la defensa de fair use de las empresas de IA no puede sostenerse

Impacto del informe y reacción del ámbito académico

  • Se espera que el informe final se publique pronto sin cambios importantes
  • El académico en derecho Blake. E Reid evaluó que este informe es “muy desfavorable para las empresas de IA” y que “podría llevar directamente a perder en tribunales”
  • Actualmente Google, Meta, OpenAI y Microsoft son parte en demandas relacionadas con copyright

Contexto de la destitución y trasfondo político

  • Como el momento de la destitución de la directora coincidió con la publicación del informe, han surgido dudas sobre la postura oficial de que se trató de una “publicación en respuesta a consultas del Congreso y de partes interesadas”
  • El profesor Reid señaló que la publicación apresurada del informe por parte de la Oficina de Copyright podría ser una señal de una purga interna en la organización
  • De hecho, se informó que la administración Trump destituyó a la directora Shira Perlmutter

Repercusiones políticas y vínculo con Elon Musk

  • El congresista Joe Morelle subrayó que la destitución ocurrió justo después de que la directora de la Oficina de Copyright no aceptara la exigencia de Elon Musk de usar material con copyright para entrenar modelos de IA
  • Musk y Jack Dorsey han defendido la “eliminación de todas las leyes de propiedad intelectual (IP)”, y también se observan movimientos hacia cambios de política, como impulsar el entrenamiento de IA a través de publicaciones en X (antes Twitter)

Otras posibles razones de la destitución

  • Considerando que la Oficina de Copyright depende de la Biblioteca del Congreso de EE. UU. (Library of Congress), se menciona la posibilidad de relación con el reciente caso en que la directora de la biblioteca fue destituida por impulsar políticas de diversidad (DEI) y por asuntos vinculados con la selección de libros infantiles
  • Por ello, esta destitución podría estar conectada de manera compleja con diversos factores internos y políticos, como la política de IA, grandes donantes o las políticas DEI

1 comentarios

 
GN⁺ 2025-05-13
Opiniones de Hacker News
  • Se menciona que si EE. UU. impidiera que los LLM usaran material con copyright, o exigiera compensar a todos los titulares de derechos, otros países como China no harían lo mismo. Eso generaría preocupación de que las empresas estadounidenses de LLM quedaran rezagadas en la competencia o en desventaja por los costos. Al final, en términos de utilidad de la IA, otros países como China terminarían tomando la delantera. Claro, creo que hay que hacer lo correcto, pero en las decisiones del gobierno sobre regulación de IA también está implícita la preocupación por quién tendrá la iniciativa en el mundo del futuro
    • Siguiendo esa lógica, también se llegaría a la conclusión de que un ciudadano común puede lavar la propiedad intelectual de una empresa porque China jamás va a seguir esas reglas. Si al otro le parece bien, yo también me sumo
    • En general, estoy de acuerdo en que permitir por completo el acceso a material con copyright podría hacer a la IA más poderosa. Pero me pregunto qué significa exactamente "más poderosa". Pensando en seguridad nacional, estoy a favor de permitir a los LLM acceso total a información académica, científica y técnica. Tengo más dudas con el código propietario, aunque creo que ya hay suficientes datos de código. Pero no veo qué ventaja real habría en que un LLM tenga acceso total a material con copyright, en comparación con acceder solo a artículos, datos técnicos y material licenciado. Al final, el LLM se vuelve una máquina de plagio mucho más potente, pero no realmente más inteligente. Lo mismo aplica a los modelos de imagen y video. Con acceso a material con copyright, el modelo puede producir más imágenes o reproducir a Mario y Luigi en escenarios infinitos, pero como no hay una ganancia real, más bien esos modelos deberían prohibirse. No hay una ventaja importante en seguridad ni en economía
    • El verdadero problema es que las empresas de IA ni siquiera intentan cambiar la ley por su cuenta como hacen las grandes corporaciones de siempre
    • Por otro lado, si hay un presidente que impone aranceles de 145% a China, también podría poner un arancel de 1000% a los chatbots chinos por internet, o cortar los cables de internet alegando una emergencia nacional. No está claro qué hará China en adelante, pero al menos parece probable que prohíba el uso de IA a menores. El tema del uso militar es aparte del tema del copyright
    • Si la IA de verdad es tan importante, entonces debería ser propiedad del gobierno y estar disponible gratis para todos los ciudadanos
    • Esta lógica podría aplicarse no solo a la IA, sino a cualquier violación de propiedad intelectual
    • Personalmente me cuesta creer que los LLM realmente contribuyan a dominar el mundo, pero la mentalidad de competencia es el trasfondo de toda esta discusión
    • Antes tampoco había ningún problema para instalar Windows con copyright. Apareció la BSA, pero ahora Microsoft hace la vista gorda porque le conviene
  • Despedir a una persona por esto es muy extraño. Parece un intento de censurar la interpretación de la ley. En mi opinión, entrenar modelos con material con copyright es claramente ilegal según la visión tradicional. Claro, un humano puede leer un libro, inspirarse y escribir otro sin que lo demanden. Basta ver la cantidad de novelas de fantasía para saber que no todas son obras completamente independientes. Como la IA es útil e innovadora, creo que hay que reconocer que la ley no contempló este caso y cambiarla
    • Se dijo que cuando un humano lee un libro y escribe inspirado por él no lo demandan, pero en realidad sí se demanda a menudo por casos de "inspiración excesiva". Son famosos los conflictos por plagio musical
    • Legalmente esto ya estaba suficientemente cubierto, pero una y otra vez se demuestra que los poderosos están por encima de la ley. Se podía haber evitado de sobra usando material publicado hace mucho tiempo, material con Creative Commons, o asegurando que la salida mantuviera cierta distancia de edición respecto del original, o contactando a los titulares del copyright para pedir permiso. Pero las empresas de IA no hacen nada de eso
    • La IA es distinta de los humanos. Que existan derechos humanos no significa que automáticamente se puedan inferir derechos para las máquinas. Siguiendo esa lógica, desechar un auto sería homicidio
    • Los humanos tampoco pueden hacer lo que quieren hacer las empresas de IA. Es como si un estudiante fuera a la biblioteca y dijera: "quiero copiar todos los libros para estudiar". Los humanos también son útiles e innovadores
    • También hay que reconocer que algo sea útil no significa automáticamente que sea una buena idea
    • Si el copyright desaparece, las empresas se van a enfurecer mucho y el sistema de patentes también colapsará. Las empresas estadounidenses perderían su capacidad de dominación global. Incluso existe el temor de que pronto la piratería de medios se redefina como la única razón para mantener el copyright, y que las instituciones actuales se conviertan en organismos de control y censura
    • Uno puede inspirarse para escribir otra novela, pero por ejemplo no estaría permitido publicar oficialmente "Hairy Plotter and the Philosophizer's Rock"
    • El problema del análisis es que ni siquiera discute la razón de existir del copyright. La creencia de que "debería permitirse que los LLM entrenen con material sin permiso" y la creencia de que "el copyright tiene sentido" son incompatibles. En la Constitución de EE. UU., el copyright existe para promover el progreso de la ciencia y las artes; en la UE, su objetivo es proteger a los creadores y fomentar la creatividad. Si yo publico un libro y las empresas tecnológicas pueden copiarlo para entrenar y luego ofrecérselo de vuelta a los consumidores, nadie va a comprar mi libro. Entonces se detendría la inversión y dejarían de hacerse libros
    • No es una excepción meter propiedad intelectual en un modelo con fines de venta y ofrecerla sin licencia
    • Si se cambia la ley, debe aplicarse a todos y no convertirse en un privilegio exclusivo para las empresas de IA
    • Si cuando un humano trabaja inspirado en obras con copyright eso no se considera infracción, entonces hay que explicar claramente por qué sí sería un problema cuando lo hace un robot. Si el robot genera una dinámica nueva de interpretación por su propia naturaleza, entonces hace falta construir un argumento que pueda aplicarse de forma ejecutable
    • No creo que la IA sea una tecnología tan útil. Empezó en los años 50 y apenas ahora se volvió medio utilizable, y aun así sigue sin funcionar bien
    • Ver películas piratas también es útil, pero eso no lo vuelve legal. Humanos e IA son completamente distintos, y el argumento de la inspiración humana no tiene fundamento
    • Para cantar un cover se necesita permiso, y hacerlo sin permiso puede ser ilegal. En cambio, escribir una canción inspirada en otra sí es legal. Si la obra generada por IA es suficientemente nueva y transformativa, no habría problema; pero si copia y entrega la obra ajena tal cual, entonces sí lo hay. La ley no debería juzgar con conceptos vagos como alma o inspiración, sino por la diferencia real en el resultado
    • Las empresas y la IA no son humanos ni ardillas. No queda claro qué sentido tiene compararlos con humanos
    • Entiendo cómo se sienten los creadores que se resisten a que el software recupere IP sin permiso. Solo me pregunto si el mero hecho de leer material ya constituye infracción de copyright. Leer o resumir nunca estuvo regulado por la ley existente. Afirmaciones como "la gente no debería leer el libro que distribuí", "la gente no debería escribir fanfic con mi estilo", o "la gente no debería practicar copiando obras maestras en un museo" están desconectadas de la realidad. Aquí hace falta una discusión social más razonable y una mejor orientación
  • A una mujer de Minnesota le impusieron una multa de 220 mil dólares por descargar ilegalmente 24 canciones
    • Se señala que ese caso es distinto del entrenamiento de modelos por parte de empresas de IA. Se sostiene que el aprendizaje de datos por una compañía de IA no es lo mismo que compartir o distribuir las canciones tal cual a otras personas
  • Hasta ahora no he visto a nadie explicar al mismo tiempo, y en detalle, la estructura técnica del entrenamiento de modelos transformer y la acusación de infracción de copyright. Es decir, son raros los casos de gente que conozca tanto el mecanismo de entrenamiento del modelo como la lógica de la infracción. Aquí se habla del proceso de entrenamiento, no del resultado generado (inferencia)
    • El problema surge cuando un transformer reproduce material para el que no tenía permiso, y eso por sí solo puede dar pie a una demanda. No está claro si el mero hecho de tocar una enorme cantidad de material con copyright ya constituye infracción. Los creadores y artistas también tienen, naturalmente, un interés en los productos derivados de sus obras. Si mi obra no hace falta, entonces que la excluyan
    • Operar el modelo en sí no es infracción de copyright, y entrenarlo con fines de análisis o investigación está bien. Pero el uso comercial, la sustitución de mercado y demás se consideran fuera del alcance del fair use
    • También me pregunto en qué se diferencia el método de entrenamiento de un transformer del de un códec de video, y cuál es la diferencia entre la compresión con pérdida y la infracción de copyright
    • Como ni siquiera podemos explicar estructuralmente el comportamiento humano, como escribir la misma frase, no hay casos donde se haya discutido claramente por qué el entrenamiento de IA sería infracción. Es decir, no existe un debate que abarque al mismo tiempo la lectura y el plagio
    • El punto de esta controversia es que las empresas de IA están usando libros descargados sin autorización, sin pagar por su uso para fines de ingestión
    • No importa cómo funcione en realidad; lo importante es qué hace en la práctica como resultado
    • Son pocos quienes combinan programación y derecho de autor, pero no es que no existan. Aun así, al final lo importante es cómo fallen los tribunales. En este caso, quizá ese contenido ni siquiera sea realmente importante
    • Si una máquina copia la obra de otra persona, eso es infracción de copyright. Los humanos y las máquinas no son lo mismo, y como no se ha demostrado lo contrario, la ley no lo permite
    • Dice que tiene pruebas de infracción y comparte material de referencia
    • Quienes conocen la estructura del método de entrenamiento más bien piensan que no hay infracción de copyright
  • El borrador del informe publicado parece limitarse a enumerar las quejas de los titulares del copyright. No hay mucha profundidad en sus fundamentos
    • No hace falta una fundamentación profunda. Si una IA lee 100 artículos y publica uno nuevo, eso es plagio. Si una persona con memoria perfecta reordena textos existentes y publica uno nuevo, eso también es infracción de copyright. La única excepción termina siendo la gran empresa
    • No se queda solo en una lista de quejas. Considera que los titulares del copyright están intentando rodear, mediante el debilitamiento del principio de fair use, una situación que les viene saliendo mal en los tribunales
    • No me despierta mucha simpatía
  • No puedo estar de acuerdo con la conclusión de que si la IA usa comercialmente una enorme cantidad de obras con copyright para producir contenido que compite con el mercado existente, entonces eso excede el fair use. Me pregunto por qué tomar un poco de muchas fuentes distintas y crear algo de forma creativa no sería fair use. Al final, este argumento lleva a cuestionar el interés público y el propósito fundamental del copyright
  • Se señala que en la administración actual están pasando demasiadas cosas en favor de grupos de interés especial
  • Recomiendan consultar el PDF "Copyright and Artificial Intelligence Part 3: Generative AI Training"
  • Siento que la ley de propiedad intelectual se está convirtiendo en una herramienta de litigio para grandes empresas que frena la difusión de ideas. Si fuera ilegal conocer todo el contenido de un libro, entonces no está claro hasta qué punto podría restringirse incluso una codificación parcial de ese contenido. Cuando un juez decida aquí, no estará resolviendo solo un problema de copia comercial, sino de control del conocimiento colectivo de la humanidad
  • Coinciden en que este mismo tema vuelve a repetirse otra vez, igual que en debates anteriores