5 puntos por GN⁺ 2024-05-10 | 1 comentarios | Compartir por WhatsApp

Reacción de los usuarios al anuncio de la alianza entre Stack Overflow y OpenAI

  • Algunos usuarios están reaccionando negativamente al reciente anuncio de la alianza entre Stack Overflow y OpenAI
  • Algunos usuarios intentaron eliminar su contenido (preguntas y respuestas) de Stack Overflow, pero tuvieron dificultades porque el sitio web no permite hacerlo fácilmente
  • Como respuesta, esos usuarios decidieron editar sus preguntas o respuestas para "vandalizarlas" en protesta por la colaboración entre Stack Overflow y OpenAI

Resumen de la alianza entre Stack Overflow y OpenAI

  • Stack Overflow y OpenAI acordaron colaborar mediante una nueva alianza de API
  • Esta colaboración busca combinar la enorme plataforma de conocimiento de Stack Overflow con los avanzados modelos de IA de OpenAI para ofrecerlos a los desarrolladores
  • Los usuarios de OpenAI podrán aprovechar los datos precisos y verificados de Stack Overflow a través del acceso a OverflowAPI, lo que permitirá resolver problemas más rápido y concentrarse en tareas prioritarias
  • Además, OpenAI planea integrar en ChatGPT el conocimiento técnico verificado de Stack Overflow para mejorar el acceso de los usuarios a información y código confiables

Rechazo hacia la IA

  • Los sitios de Stack Overflow y Stack Exchange son herramientas muy útiles para la comunidad, pero algunos usuarios no están nada contentos con que su contenido se use para entrenar IA y luego generar respuestas sin atribución
  • Esta es una reacción cada vez más común entre creadores de contenido no solo en Stack Overflow, sino en todo internet
  • Actualmente, internet atraviesa un período de cambios: disminuyen el tráfico de blogs y las páginas vistas, aumentan las búsquedas de respuestas usando IA y algunas personas incluso usan menos los motores de búsqueda
  • Es una etapa de tensión en la que conviven la adaptación a las nuevas capacidades de ChatGPT y otros LLM (modelos de lenguaje grandes), junto con la incertidumbre sobre lo que todo esto significa para el internet que conocemos
  • La reciente reacción negativa ante la alianza entre Stack Overflow y OpenAI es solo un ejemplo de cómo algunas personas responden mal a la adopción masiva de la IA y a los cambios drásticos que esta trae consigo

¿Stack Overflow está bloqueando cuentas por eliminar contenido?

  • Varios usuarios publicaron en Twitter y Hacker News que, después de intentar eliminar varias preguntas y respuestas que habían publicado anteriormente en Stack Overflow, recibieron correos de moderadores informándoles que sus cuentas quedaban suspendidas o temporalmente bloqueadas por 7 días
  • Según los correos del equipo de moderación de Stack Overflow, borrar o retirar contenido que podría ser útil para otras personas puede generar confusión en toda la comunidad, incluso si ese contenido ya no le resulta útil a su autor
  • El negocio de Stack Overflow y de toda la red Stack Exchange depende del contenido generado por los usuarios para mantener la utilidad del sitio, por lo que es evidente que existen razones comerciales para no querer que los usuarios retiren contenido en masa
  • Probablemente no sea algo nuevo que Stack Overflow suspenda cuentas y envíe correos de advertencia. Seguramente estas políticas se han aplicado desde hace mucho tiempo para proteger la plataforma
  • Si los usuarios pudieran vandalizar o eliminar fácilmente grandes cantidades de contenido, eso podría causar una confusión considerable en la plataforma, por lo que proteger el contenido va en beneficio de Stack Overflow y de la comunidad
  • También es muy probable que estos correos sean automatizados y se activen por el comportamiento del usuario, por lo que una buena medida sería contactar directamente a Stack Overflow respecto al contenido
  • Hasta ahora no se ha visto una respuesta de Stack Overflow sobre estas suspensiones de cuenta. Tampoco está claro cuántos usuarios realmente están intentando hacerlo, así que puede que no exista una gran reacción en contra de la alianza entre Stack Overflow y OpenAI
  • Como el impulso hacia la adopción de IA probablemente no se desacelere en el corto plazo, será interesante observar cómo evoluciona todo esto en adelante
  • No se recomienda a otros usuarios de Stack Overflow eliminar su contenido como forma de protesta

Opinión de GN⁺

  • La alianza entre Stack Overflow y OpenAI parece que tendrá un gran impacto tanto en el avance de la tecnología de IA como en la comunidad de desarrolladores. Sin embargo, sigue pendiente cómo equilibrar la protección de la propiedad intelectual de los desarrolladores individuales con el uso de ese contenido como datos de entrenamiento para IA
  • Los desarrolladores deberían poder compartir su conocimiento y al mismo tiempo recibir una compensación justa por ello. Stack Overflow parece necesitar un sistema de compensación adecuado para hacerlo posible
  • La confianza en la comunidad es muy importante para incentivar que los desarrolladores compartan conocimiento de forma voluntaria. A raíz de esta situación, parece necesario un enfoque cuidadoso para evitar que se deteriore la confianza de los desarrolladores en Stack Overflow
  • Por otro lado, mejorar la productividad en el desarrollo mediante tecnologías de IA como ChatGPT también representa una gran ventaja para los desarrolladores. Habrá que buscar formas de maximizar esos beneficios mientras se minimizan efectos secundarios como los problemas de privacidad
  • Un caso similar fue la controversia por derechos de autor en torno a GitHub Copilot. Parece necesario impulsar un debate activo dentro de la comunidad de desarrolladores para encontrar un punto de acuerdo que resulte aceptable para todos

1 comentarios

 
GN⁺ 2024-05-10
Opiniones en Hacker News
  • Problemas con el cambio de licencia del contenido de usuarios en StackOverflow:
    • Hace unos 5 años, StackOverflow declaró por error que todo el contenido enviado por usuarios se ofrecía bajo CC-BY-SA 4.0. El acuerdo original con los usuarios era CC-BY-SA 3.0.
    • Desde mediados de 2018 hasta principios de 2019 hubo confusión sobre las licencias aplicables al código y al contenido no relacionado con código.
    • A principios de 2019, se pidió a los usuarios volver a iniciar sesión y aceptar un nuevo acuerdo de licencia.
    • Actualmente, al contenido anterior al 5 de mayo de 2018 se le aplica CC-BY-SA 3.0, y al posterior, CC-BY-SA 4.0.
  • Opiniones de los usuarios sobre los scrapers de IA de StackOverflow y la entrega de datos a OpenAI:
    • Hay usuarios a quienes no les molesta que sus respuestas se usen para entrenar IA. Consideran que aporta mucho valor a herramientas como ChatGPT.
    • La alianza con OpenAI no es el punto central del problema de eliminación de contenido por parte de los usuarios. Según la licencia, borrar contenido nunca fue bien visto y por lo general se revierte.
    • Debido a la licencia CC-BY-SA, aunque StackOverflow no lo permitiera, otras personas pueden copiar el contenido, así que eliminarlo es difícil.
    • Los usuarios pueden quitar su nombre o editar datos personales, pero no pueden retirar después el contenido de calidad en sí.
  • El problema de que empresas con fines de lucro administren productos "gratuitos":
    • Como tienen que generar ingresos, no están atadas a la ética del open source. Los usuarios creen que están contribuyendo al open source, pero en realidad no es así.
    • Lo que hace StackExchange probablemente sea legal, pero quienes contribuyen no son parte interesada, y basta con mantener solo el nivel de contribuyentes comercialmente sostenible.
    • En productos ofrecidos gratis, el usuario termina siendo el producto, y si no sabes cómo se monetiza, en algún momento vas a decepcionarte.
  • La necesidad de nuevas licencias de contenido especializadas para entrenamiento de IA:
    • Podrían aparecer licencias inspiradas en el espíritu de la GPL, por ejemplo exigiendo publicar los pesos de IA cuando se use contenido para entrenamiento comercial.
  • El modelo de venta de datasets de StackOverflow:
    • Desde el principio, StackOverflow no se centró en los usuarios sino en construir un dataset para SEO. El acuerdo con OpenAI no cambió demasiado eso.
    • Con la llegada de los LLM, la crisis de StackOverflow es inevitable, así que es mejor sacar provecho vendiéndole a OpenAI antes del colapso.
  • La importancia de la cláusula ShareAlike de la licencia CC BY-SA:
    • La cláusula que exige distribuir los derivados bajo la misma licencia si se crea una obra derivada es muy amplia y ambigua. La definición de "build upon" puede no resultar atractiva para muchos usuarios.
  • Comparación de ventajas y desventajas entre los LLM y StackOverflow:
    • Gracias a los LLM, ahora es posible evitar StackOverflow en la medida de lo posible. StackOverflow está lleno de elitismo y de una toxicidad que prioriza el procedimiento por encima de la ayuda real.
    • Hay quejas de que los LLM a veces dan respuestas incorrectas, pero muchas respuestas en StackOverflow también están completamente mal o no tienen relación con la pregunta. Además, hay muchas respuestas desactualizadas.
    • Lo ideal sería combinar la capacidad de redacción de los LLM con la verificación de los usuarios de StackOverflow. Quizá no sería bueno para quienes solo buscan ganar puntos en internet, pero sí sería lo mejor para los usuarios.
  • Mensajes automáticos de advertencia de StackOverflow sobre la eliminación masiva de contenido:
    • Parece que existen al menos desde 2017 y que se muestran automáticamente cuando se detecta una eliminación masiva.
    • Como StackOverflow tiene un carácter más cercano a una wiki que a un foro, se entiende la razón de esta política. No parece que se haya introducido para sofocar protestas contra OpenAI.
  • También hay quien comenta que, personalmente, casi no ha usado StackOverflow en los últimos 2 años.