- Un tribunal de Estados Unidos ordenó a OpenAI conservar indefinidamente todos los registros de ChatGPT (incluidos los chats eliminados), y dos usuarios intentaron intervenir alegando "vigilancia masiva", pero su pedido fue rechazado
- Uno de los usuarios sostuvo que, como había ingresado información personal y comercial sensible, la orden equivalía a un programa de vigilancia masiva a nivel nacional en Estados Unidos
- El juez dejó en claro que una simple orden de preservación de pruebas no es un programa de vigilancia, y que el Poder Judicial no es un organismo de investigación
- La organización de derechos digitales EFF también expresó preocupación por los riesgos para la privacidad de los usuarios y por posibles usos indebidos en el futuro
- Los usuarios muestran inquietud por la firme disposición de OpenAI a responder y por una eventual divulgación de datos o falta de transparencia en el futuro
Contexto y orden judicial
- Recientemente, un tribunal ordenó a OpenAI conservar indefinidamente todos los registros de ChatGPT, incluso los chats eliminados
- La medida fue dictada para preservar pruebas en una demanda por derechos de autor presentada por empresas de medios de comunicación
- Algunos usuarios expresaron preocupación porque la orden incluye chats eliminados y anónimos, y se está aplicando sin notificar a los usuarios
Intento de intervención de usuarios y controversia sobre privacidad
- Uno de los usuarios pidió intervenir alegando que, como había ingresado información personal y comercial sensible, la orden derivaba en vigilancia masiva en todo el país
- Cuestionó que se conservaran chats eliminados y anónimos sin aviso previo, y pidió excepciones para chats sobre temas sensibles como salud, finanzas y asuntos legales
- El tribunal dejó clara la razón del rechazo al señalar que "una orden de preservación de documentos no tiene relación con la vigilancia, y los tribunales no son organismos de investigación"
La perspectiva de las organizaciones de derechos digitales
- Corynne McSherry, directora legal de Electronic Frontier Foundation (EFF), advirtió que "esta orden plantea un riesgo real para la privacidad de los usuarios y podría afectar negativamente litigios similares"
- Señaló que podría sentar un precedente para que, en el futuro, autoridades o partes en litigio exijan a OpenAI entregar registros de usuarios
- En particular, subrayó que, si son insuficientes el control de los usuarios sobre sus registros y la obligación de notificar, los chatbots de IA podrían convertirse en un nuevo vector de vigilancia
Fundamento del fallo judicial
- El juez consideró que la orden de preservación documental busca conservar pruebas para un litigio específico, y que posibles violaciones de derechos constitucionales no guardan relación con el fondo de esta causa
- Determinó que el intento de intervención no estaba relacionado con el esclarecimiento de los hechos ni con los puntos en disputa, y solo retrasaría el proceso, por lo que no reconoció ese derecho
- Como todavía no hubo ningún caso en que datos reales se entregaran a empresas periodísticas, dejó entrever que podría haber más discusión si en el futuro esos datos llegaran a compartirse
Inquietud de los usuarios y temas a futuro
- Un usuario expresó preocupación porque "OpenAI podría priorizar otros intereses, como los costos del litigio o la gestión de su reputación, por encima de la protección de la privacidad"
- EFF y otros remarcan que las empresas de apps de chat con IA deben eliminar realmente los registros cuando se solicita borrarlos y notificar con transparencia los pedidos de acceso a datos
- En última instancia, la transparencia en la conservación y divulgación de datos de usuarios, los procedimientos de notificación y las vías de reparación posteriores emergerán como temas clave
1 comentarios
Comentarios de Hacker News
Al ver la declaración del juez citada en el artículo, da la impresión de que no entendió bien el fondo del cuestionamiento, y al mismo tiempo la justificación del fallo también se siente extraña
La lógica parece ser: "Si consideráramos este tipo de preguntas, solo causaríamos demoras indebidas para resolver las cuestiones legales que realmente debemos tratar"
Eso hace preguntarse si, por tratarse de una demanda de copyright, entonces se pueden ignorar los temas constitucionales
Además, rechazar de inmediato la solicitud solo porque no fue redactada por un abogado me parece una actuación impropia de un juez
Parece que pasó por alto que también se puede presentar una demanda sin abogado
Si lees la orden judicial completa adjunta al artículo (aquí), la situación queda más clara
La parte que planteó la objeción presentó una forma específica de "solicitud de intervención", y eso tiene requisitos estrictos
No cumplió con esos requisitos
El tema de que fue rechazada por haberse presentado sin abogado también aparece mencionado en la orden
Una persona puede representarse a sí misma, pero una entidad legal (empresa) necesariamente debe tener abogado
Como al inicio se presentó a nombre de una empresa, parece que el juez actuó conforme a la ley
Yo siento algo parecido, y me preocupa más que existan muchísimos servicios similares que también podrían verse afectados por este tipo de problemas de privacidad
Hacen falta leyes de privacidad fuertes que impidan órdenes judiciales tan excesivas, y todavía no las hay
Por ejemplo, podría ordenarse a un servicio de citas guardar todos los mensajes intercambiados entre usuarios, a las telefónicas conservar todos los SMS, o almacenar miles de millones de Google Docs generados
Me pregunto por qué el gobierno todavía no ha exigido que servicios como Signal agreguen puertas traseras y almacenen todos los mensajes de texto
Creo que para lograr algo así tendría que existir una justificación muy fuerte
Me pregunto si el gobierno de EE. UU. ya habrá estado realizando este tipo de vigilancia tan amplia incluso sobre servicios comerciales comunes
Ya antes, con las filtraciones de Edward Snowden, hubo interceptación de comunicaciones de Google
Por lo general, los jueces vienen del ejercicio de la abogacía o tienen experiencia legal
Esta jueza también fue abogada y además tiene una trayectoria poco común, habiendo casi terminado un doctorado en zoología
Es muy natural que los sectores protegidos de la sociedad no intenten tratar en pie de igualdad a los sectores no protegidos
Tampoco parece claro que aquí exista una cuestión constitucional, y aun si la hubiera, este no es el ámbito para decidirla
La crítica por haberlo ignorado por presentarse sin abogado es 100% un malentendido
El proceso pro se (litigar en nombre propio) está bien regulado
Si se intenta iniciar un litigio en representación de otra entidad legal, obligatoriamente hace falta un abogado
Más que una idea de que "como el caso trata de copyright se pueden ignorar los temas constitucionales", lo que hay es que, a juicio del juez, probablemente no se configure una cuestión constitucional y solo se perdería tiempo
Sobre la parte de "¿porque es una demanda de copyright se pueden ignorar los temas constitucionales?"
Me gustaría saber qué cuestión constitucional concreta se considera que existe
La afirmación de que "también se puede hacer sin abogado" tampoco es correcta en este caso, porque legalmente una empresa sí debe tener abogado
Si una persona actúa directamente puede recibir cierta flexibilidad, pero eso no aplica a una empresa
Si el razonamiento falla en algo tan básico, cuesta confiar en los demás argumentos
Este asunto no parece tener tanta relevancia noticiosa
OpenAI pronto presentará argumentos orales para intentar frenar directamente la orden de preservación de datos, y las dos solicitudes previas presentadas por usuarios comunes de ChatGPT no eran casos que fueran a decidir el resultado
Parece que la jueza no entiende bien el impacto real de ordenar a una empresa "preservar todos los datos" y tampoco muestra voluntad de reconsiderarlo con rapidez
Se argumenta que el impacto del fallo inicial ya es en sí mismo lo que lo vuelve noticia
Hoy en día creo que incluso una conclusión demasiado obvia puede tener muchísimo valor noticioso
Al menos esto confirma que los usuarios sí tienen derecho a participar directamente
Igual que hizo el demandante, también pueden presentar una demanda por cuenta propia
El resultado es otra cuestión, pero ese derecho existe
La conclusión es que, como la jueza no parece interesada en este tema, intentar persuadirla no sirve de mucho
Entonces surge la duda de qué alternativas o opciones tienen OpenAI y los usuarios
No es una respuesta directa, pero creo que usar un LLM local será la alternativa más realista hacia adelante
He estado probándolo últimamente y todavía tiene limitaciones en memoria de contexto o alto rendimiento, pero no me parece descabellado pensar que en 1 o 2 años habrá LLM locales suficientemente prácticos
En mi caso, más que la privacidad, me atrae su utilidad sin conexión
Bajo la ley de EE. UU., no hay opciones
Esto encaja de lleno en la típica third-party doctrine
Aunque sean tus propios datos, si los entregas voluntariamente a un tercero (OpenAI), esos datos dejan de ser realmente tuyos y ya no existe una expectativa de privacidad
Las únicas excepciones tendrían que surgir de una ley nueva creada específicamente para ello, y OpenAI no está cubierto por ninguna en la legislación actual
El fallo también se da dentro de ese marco legal estadounidense: hoy por hoy, la privacidad de las conversaciones enviadas a OpenAI no está protegida
Ya convendría dejar de esperar privacidad de terceros
Incluso la información bancaria puede revelarse si existe una orden de investigación
Hay muchos programadores que se confunden con los temas de moda y no entienden esta realidad básica
Sea cual sea el fallo que venga después, una apelación podría ser una alternativa
A la pregunta "¿qué opciones tienen OpenAI y los usuarios?"
Una posibilidad es buscar servicios de países que no entreguen sus datos a EE. UU.
Si alguien cree que OpenAI no va a guardar todo lo que se ingresa en sus chats o en la API, le recomendaría revisar bien la composición actual de su junta directiva
Incluso si a proveedores de LLM como OpenAI se les prohibiera legalmente almacenar datos, sería difícil confiar en que realmente cumplirían bien esa política
Yo sugeriría que los datos sensibles siempre se introduzcan directamente en un LLM local
Ojalá se note la doble negación
Ahora que el mundo ya tiene la capacidad técnica de vigilar todos los aspectos de la vida cotidiana, la cuestión es cómo manejar eso
En el futuro, esta enorme masa de datos podría dar lugar a nuevos campos como medicina, epidemiología, psicología a gran escala (yo lo llamaría Massive open online psychology, moop), e incluso permitir que los gobiernos atiendan mejor a ciudadanos marginados con big data en tiempo real
Pero para que ese futuro sea viable, necesariamente hace falta un marco legal confiable, y no creo que eso pueda construirse de forma fragmentaria fallo por fallo
Personalmente, creo que debería existir el principio de que cualquier dato que no podría existir sin la acción directa de una persona debe pertenecer siempre a esa persona, y que su custodia por terceros solo debería permitirse cuando se use en beneficio de ese ser humano
Si se adoptara un estándar alto como "en beneficio del usuario/ciudadano", la forma de pensar de las empresas de datos cambiaría por completo
Me interesa saber qué opinan otros sobre esto
Por ahora esa dirección sigue siendo medio tabú en HN y espacios similares, pero creo que solo si los datos quedan bloqueados en torno al usuario y distribuidos en lugar de quedar encerrados en silos centralizados, se podrá aspirar a tener privacidad y al mismo tiempo las ventajas del big data
En realidad, la jueza de este caso es una magistrate judge a la que le queda poco más de un año de mandato
Ya ha habido casos antes en que a magistrate judges que emitieron decisiones débiles no les renovaron el mandato, y ojalá pase lo mismo esta vez
Enlace al aviso de renovación del mandato
No entiendo por qué poner comillas al título de juez
Un magistrate judge sigue siendo, sin duda, un juez
Referencia: tipos de jueces en los tribunales federales de EE. UU.
No creo que una aplicación normal de la Third Party Doctrine deba afectar negativamente ni el mandato ni la reputación de una magistrate judge
Referencia a una discusión anterior sobre el mismo tema OpenAI responde a una orden judicial para conservar todos los registros de ChatGPT, incluidas conversaciones eliminadas
Ningún juez puede detener un programa de vigilancia masiva que lleva más de 10 años en marcha
A estas alturas ya es casi un chiste y una polémica vacía
OpenAI, como otras empresas, recopila toda la información posible y nos perfila
Me parece raro que tanta gente se muestre sorprendida o indignada por esta situación
La mayoría no sabe o pasa por alto que los servicios en línea que usan todos los días hacen exactamente lo mismo con los datos
En la práctica, salvo casos como Signal con E2EE, servicios principales como Gmail, las telefónicas, Reddit, Xitter y otros conservan tanto los datos como los metadatos
Más allá de si eso está bien o mal, es la realidad normal de los servicios en línea actuales
La razón del enojo es que esta realidad empieza a sentirse como algo inaceptable
Más allá de términos y políticas, OpenAI ahora estaría obligada a conservar incluso datos que intentaba borrar por sus usuarios
A mí no me sorprende que la gente exprese activamente su postura
Creo que la mayoría de las personas no tiene idea de esto
Si le preguntas a amigos no técnicos o a cualquiera en la calle, muchas veces ni siquiera son conscientes de esta realidad