- Matthew Butterick, desarrollador y abogado, demandó a Microsoft, GitHub y OpenAI
- Alega que violaron licencias de código abierto y vulneraron los derechos de los programadores
- Licencias como GPL, Apache y MIT exigen atribuir el nombre del autor, pero Copilot lo ignora
Incluso se copian tal cual fragmentos de código de más de 150 caracteres
- Algunos programadores lo señalan como una forma de "lavado de código abierto"
- El bufete que representa la demanda afirmó: "Parece que Microsoft está obteniendo beneficios del trabajo ajeno al ignorar las condiciones de las licencias de código abierto y otros requisitos legales"
- Aparte de la violación de licencias, Butterick sostiene que esta función también infringe otras normas
- Los Terms of Service y las Privacy Policies de GitHub
- La DMCA 1202, que prohíbe eliminar información de gestión de derechos de autor
- La California Consumer Privacy Act
3 comentarios
Al final, supongo que esto se podría resolver separando los datos de entrenamiento según la licencia de open source y haciendo que se puedan elegir desde las opciones de Copilot, ¿no? Y que también genere correctamente la mención de la licencia de acuerdo con eso. ¿Ya funciona así? Como no he usado Copilot...
Sin duda es un tema grande, pero parece que la forma de resolverlo también está bastante clara.
Esto también causa muchos problemas cuando una persona programa, ¿no? A veces en la empresa buscan a alguien que no haya leído el código de una implementación open source de cierta especificación XXX (por ejemplo, Linux). (Para hacer una implementación clean room). A veces incluso, si durante el trabajo compartes sin pensar un enlace al código de Linux, te reclaman: "¡No puedo leer ese código!". Y a veces también es incómodo cuando ni siquiera recuerdas si alguna vez leíste ese código.
Parece que esto se podrá resolver de una manera todavía más clara que los problemas que enfrentan las personas.
Cuando se anunció Copilot...
Al principio fue como wow~, pero unos días después surgieron este tipo de problemas relacionados con las licencias.
Vi opiniones de que, si se usaba mal, podía convertirse sin querer en un gran problema si al desarrollar el código del producto de una empresa se terminaban metiendo bloques enteros de código con licencia GPL... y ahora se volvió realidad.
Que se copie tal cual es un poco... complicado. Por eso se está debatiendo tanto todo el tema de la IA explicable... una IA que pueda explicar por qué salió ese resultado.
Si Copilot pudiera hacer eso, parece que podría evitar buena parte de la controversia agregando como comentario el código open source que influyó en el resultado.