10 puntos por GN⁺ 2024-10-28 | 2 comentarios | Compartir por WhatsApp
  • Mark Zuckerberg, CEO de Facebook, afirma que Llama 3, el modelo de lenguaje grande de Meta, es open source, pero en realidad no lo es
  • Según la definición de open source de la Open Source Initiative (OSI), la licencia de Llama 3 no cumple las condiciones de open source en varios aspectos
  • Meta no es la única empresa que recurre a este engaño. A esto se le llama "open washing"
    • El open washing es la práctica engañosa de presentar un producto o servicio que en realidad no es abierto como si lo fuera
    • El término fue acuñado en 2009 por la investigadora de políticas de internet Michelle Thorne, inspirándose en "greenwashing"
  • En el campo de la IA, el open washing está muy extendido. De los 45 modelos estudiados por investigadores de Radboud University, los modelos de grandes empresas como Google, Meta y Microsoft no son realmente open source

Por qué las empresas hacen open washing

  • Antes evitaban el open source, pero ahora la percepción sobre el open source ha cambiado de forma positiva
    • En 2001, Steve Ballmer declaró que "Linux es un cáncer" y sostuvo que usar software open source obligaría a convertir también el resto del software en open source
  • Las empresas aprovechan la imagen positiva del open source, pero en la práctica no se comprometen realmente con él
    • Esto ayuda a mejorar su imagen pública y a atraer a consumidores que valoran la transparencia y la apertura
    • Algunas empresas, mediante el open washing, protegen sus modelos y prácticas del escrutinio científico y regulatorio mientras disfrutan de los beneficios de llevar la etiqueta de "abierto"
    • La Ley de IA de la UE otorga exenciones especiales a los modelos "open source", lo que crea un fuerte incentivo para el open washing

Falta una definición clara de IA open source

  • La UE todavía no ha logrado definir con claridad qué es la IA open source y, en realidad, nadie lo ha hecho todavía
    • La OSI tiene previsto publicar su definición de IA open source en los próximos días
    • Las actuales licencias de open washing no encajan en la definición de nadie, excepto quizá en la de sus propios creadores
  • Sin embargo, no todas las grandes empresas de IA están mintiendo sobre el open source
    • Por ejemplo, el LLM Granite 3.0 de IBM sí se ofrece realmente como open source bajo licencia Apache 2
  • Aunque la OSI no sea un gobierno ni un regulador, ¿por qué importa usar correctamente el término open source?
    • La OSI es simplemente una organización sin fines de lucro que creó una guía útil
  • Dan Lorenc, CEO de Chainguard, dijo recientemente en su discurso principal en la conferencia SOSS realizada en Atlanta:
    • Nadie puede obligar a otros a usar la definición de la OSI, pero mucha gente, especialmente los abogados, confía en ella
    • Confían en el trabajo de la OSI y entienden la protección que reciben las empresas cuando usan licencias que cumplen con los criterios de open source
    • Por eso esta definición aparece en contratos de adquisición de grandes empresas de todo el mundo

El open source no es solo un tema legal o de negocio

  • El open source ofrece a los desarrolladores una forma de trabajar con libertad
    • Sin open source, se perdería la ventaja de poder usar código libremente sin tener que conocer o preocuparse por todos los distintos términos de las licencias
    • Si hubiera que revisar una por una las licencias de todo el código, los desarrolladores tendrían que pasar por revisión legal cada vez que quisieran usar una nueva biblioteca
    • Las empresas tendrían miedo de publicar cualquier cosa en internet si no estuviera claro qué responsabilidades enfrentarían al abrir su código fuente
  • Lorenc enfatizó que no se trata de un problema exclusivo de las grandes empresas, sino de un problema compartido
    • Todas las personas que usan open source se verían afectadas
    • Proyectos completos podrían dejar de funcionar, los fallos de seguridad no se corregirían y el mantenimiento sería mucho más difícil
    • Debemos actuar juntos para preservar y defender la definición de open source. De lo contrario, los abogados volverán a intervenir
  • Muchos abogados de propiedad intelectual no quieren lidiar con este tipo de dolores de cabeza
    • Las verdaderas licencias open source hacen la vida más fácil para empresas, programadores y abogados por igual
    • Introducir cláusulas como "abierto excepto para quienes puedan competir con nosotros" o "abierto excepto para quienes puedan desplegar el código en la nube" es buscarse problemas

El open washing perjudica a todos

  • Al final, el open washing terminará contaminando el trabajo legal, de negocio y de desarrollo de todos
  • Irónicamente, incluso las empresas cortoplacistas que hoy respaldan este enfoque saldrán perjudicadas
  • Porque, al final, casi todo su trabajo —especialmente en IA— se basa en open source

Opinión de GN⁺

  • Las prácticas de open washing que erosionan la definición de open source pueden afectar negativamente no solo al campo de la IA, sino a toda la industria del software. Restringen la actividad de los desarrolladores y aumentan el riesgo legal para las empresas
  • Que las empresas quieran aprovechar solo la imagen positiva del open source es una postura cortoplacista. A largo plazo, incluso puede terminar perjudicándolas a ellas mismas
  • Para el avance de la tecnología de IA, la colaboración y el intercambio basados en el espíritu del open source son esenciales. Las empresas deberían liderar la construcción de una verdadera cultura open source
  • Es urgente establecer una definición y criterios claros para la IA open source. La definición de IA open source de la OSI se publicará próximamente, y a partir de ella empresas, gobiernos y la comunidad de desarrolladores deberán colaborar
  • También hace falta promover la concientización entre consumidores y desarrolladores para prevenir el open washing. Es importante no aceptar sin más las afirmaciones de las empresas sobre ser "abiertas", sino revisar con cuidado sus licencias y prácticas reales

2 comentarios

 
ndrgrd 2024-10-28

Parece que se ve seguido el fenómeno de publicar un proyecto como código abierto para dejar las correcciones iniciales de bugs y las mejoras de funciones en manos de la comunidad, y luego, una vez que se estabiliza, retirarlo discretamente otra vez bajo una licencia privativa.

Algunos dicen que basta con hacer un fork, pero al final la empresa simplemente se queda con la imagen y el valor de marca que ya se habían consolidado.

 
GN⁺ 2024-10-28
Opiniones de Hacker News
  • Al elegir entre dos programas o modelos de IA, surge un debate entre quienes prefieren el código abierto y quienes no. El objetivo es hacer que incluso los programas que no son de código abierto parezcan serlo.

  • El código abierto fue un compromiso amigable para las empresas, pero algunos participantes tenían una moral muy elevada. Quienes tienen esa postura moral deben evitar el abuso del código abierto.

  • Si no puede resolverse mediante marcas registradas, certificaciones o licencias, entonces hay que comunicar el mensaje a través de los medios generalistas. <i>The Register</i> tiene conocimiento interno, pero esto debería darse a conocer ampliamente al público.

  • Varias empresas critican el código abierto mientras operan sus negocios dependiendo de software de código abierto como Linux, Java y Debian. La mayoría de las empresas no siente ninguna obligación de contribuir o apoyar.

  • La OSI está preparando una definición controvertida de código abierto para IA.

  • thirdweb es técnicamente de código abierto, pero no funciona sin una API key y revisa los límites de llamadas API en su SaaS. Esto desanima a los equipos que intentan crear una alternativa verdaderamente de código abierto.

  • Como resultado de no haber logrado popularizar conceptos como fair source, las pequeñas empresas que no son SaaS no pueden sobrevivir con código abierto.

  • El código abierto no tiene la ética ni la filosofía del software libre. El software libre es superior al código abierto.

  • En el caso de los modelos grandes, el costo de entrenamiento es alto y los artefactos binarios son valiosos y susceptibles de modificación. Si la OSI establece una definición, vale la pena elogiar su esfuerzo independientemente de si Meta la sigue o no.

  • La OSI debe reconocer que, en la era de los grandes proveedores de nube, se necesita protección frente a los participantes del mercado. Se requieren opciones de licencia claras para evitar dramas como los de Mongo, Elastic y Redis.

  • El término "Open <something>" debería protegerse para no engañar al público. Debe evitarse una confusión como la de "OpenAI".

  • Hay casos peores que usar incorrectamente el término "Open Source": aceptar contribuciones de la comunidad y luego retirar la licencia. Eso debería considerarse fraude y conllevar responsabilidad civil.

  • Si no se comparten scripts de entrenamiento reproducibles ni datos para modelos de IA, el nombre "Open Weights" sería más apropiado.