- OpenAI considera la protección de los datos de conversaciones privadas de ChatGPT, usado por más de 800 millones de personas, como su máxima prioridad
- The New York Times pidió ante el tribunal la entrega de 20 millones de registros de conversaciones privadas de ChatGPT, algo señalado como una vulneración de la privacidad de los usuarios
- OpenAI ya había rechazado antes una solicitud de 1,400 millones de registros de conversaciones y, en esta ocasión, también sigue impulsando la protección de los datos de los usuarios por la vía legal
- La empresa está desarrollando funciones de seguridad reforzadas, como el cifrado del lado del cliente, y construyendo sistemas automatizados que minimizan el acceso a datos sensibles
- Este caso es visto como un punto de inflexión importante en torno a los estándares de protección de datos personales en la era de la IA
La solicitud de datos de The New York Times y la postura de OpenAI
- The New York Times solicitó, como parte de su demanda contra OpenAI, la entrega de 20 millones de registros de conversaciones de usuarios de ChatGPT
- Afirmó que lo hacía para “verificar si los usuarios utilizaron ChatGPT para evadir el paywall de The New York Times”
- OpenAI señaló que esta solicitud viola principios de protección de privacidad y prácticas de seguridad mantenidos durante largo tiempo
- La empresa pidió al tribunal que rechazara esta solicitud, al indicar que “incluye conversaciones privadas de decenas de millones de personas no relacionadas con esta demanda”
Solicitudes similares en el pasado y la respuesta
- The New York Times ya había intentado antes limitar la función de borrado de conversaciones de los usuarios, pero OpenAI lo impidió y restableció el derecho de eliminación
- Después hubo una solicitud para entregar 1,400 millones de registros de conversaciones, pero OpenAI la rechazó
- OpenAI afirmó que “las conversaciones privadas de los usuarios pertenecen a las personas y no deben convertirse en víctimas colaterales de disputas sobre acceso a contenido en línea”
Medidas de OpenAI para reforzar seguridad y privacidad
- OpenAI, una de las organizaciones más atacadas del mundo, está realizando grandes inversiones para proteger los datos frente al crimen organizado y los intentos de hackeo respaldados por Estados
- Su hoja de ruta futura incluye la función de cifrado del lado del cliente (client-side encryption), con la que ni siquiera OpenAI podrá acceder a los mensajes de los usuarios
- También está diseñando un sistema automatizado de detección de seguridad para que solo los casos graves de uso indebido —como amenazas a la vida, daños a terceros o riesgos de ciberseguridad— sean enviados de forma limitada a equipos humanos de revisión
Detalles sobre la solicitud de datos (resumen del FAQ)
- Alcance de los datos solicitados: 20 millones de conversaciones de consumidores de ChatGPT seleccionadas aleatoriamente entre diciembre de 2022 y noviembre de 2024
- Casos excluidos del impacto: no aplica a ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (antes Team) ni a clientes de API
- Medidas de protección de privacidad: todas las conversaciones pasan por un proceso de eliminación de información de identificación personal (PII) y de datos sensibles como contraseñas
- Permisos de acceso a los datos: solo podrán acceder parte del personal de los equipos legal y de seguridad de OpenAI, además de abogados externos y asesores técnicos del lado de The New York Times
- Forma de resguardo: almacenamiento aislado dentro de un sistema de seguridad separado para cumplir con obligaciones legales, sin acceso general
Consideraciones legales e internacionales
- OpenAI indicó que está tomando las medidas necesarias para cumplir con regulaciones internacionales de privacidad como el GDPR, pero que la solicitud de The New York Times no se ajusta a sus propios estándares de privacidad
- La empresa sigue impugnando la solicitud por la vía legal y mantendrá en todo momento la protección de la privacidad de los usuarios como máxima prioridad
- OpenAI prometió ofrecer actualizaciones transparentes sobre futuras decisiones judiciales y cambios en el manejo de datos
Planes y visión a futuro
- OpenAI enfatizó que, mientras más se integre la IA en la vida de las personas, más deben fortalecerse la seguridad y la protección de la privacidad
- Su objetivo es un futuro en el que las conversaciones de IA más personales de los usuarios permanezcan seguras y privadas
- A corto plazo, planea publicar rápidamente medidas de refuerzo de seguridad y mitigaciones temporales
- A largo plazo, está impulsando el establecimiento de marcos técnicos y legales de protección para construir un entorno de IA confiable
1 comentarios
Opiniones en Hacker News
Como demandante, es una solicitud que naturalmente puede hacer, pero este tipo de litigios quizá no se limite solo al tema de derechos de autor
Más bien, el problema es por qué OpenAI está recolectando y conservando tanta información privada de conversaciones
La solicitud del NYT solo se usa dentro del proceso legal, la información confidencial se entrega con partes ocultas y se destruye cuando termina el litigio
En cambio, OpenAI conserva los datos indefinidamente para beneficio comercial
Ni siquiera está claro para qué modelo de negocio acumula estos datos. Me parece una recolección indiscriminada de datos
Documentos relacionados: orden judicial 1, orden judicial 2
Ver el artículo de Ars Technica
El problema es que, aunque el usuario presione el botón de borrar, los datos deben mantenerse por la orden judicial
Al final, creo que la causa de fondo es la infracción de derechos de autor. Está bien que el NYT esté peleando esto
Resumen de los fallos relacionados
Piensan que es hipócrita llamar la atención sin contribuir a la cultura abierta
Se indignan diciendo que las promesas sobre AGI eran falsas y que solo hicieron sentir ansiedad a la gente
Pero me incomoda que conversaciones privadas de la gente terminen en manos de los abogados del NYT
Como el NYT no ha podido demostrar un daño claro, esto parece una fishing expedition
Lo compara con pedir los registros de ventas de una librería de copias pirata
Dice que legalmente es difícil que los usuarios puedan reclamar un derecho de privacidad
La clave es si el entrenamiento de IA constituye infracción de copyright y si entra o no en fair use
También señala que OpenAI respondió de forma poco diligente durante el litigio
PDF de la demanda del NYT
Los que puedan ignorar el copyright terminarán con ventaja competitiva
Solo que casi nadie los leyó
ESPN vs YouTube, y ahora OpenAI vs NYT
No me dan ganas de apoyar a ninguno de los dos. Aun así, si OpenAI de verdad no reproduce literalmente frases del NYT, no debería tener por qué temer una verificación
Propongo una verificación neutral por un tercero: que un tercero compare los artículos del NYT con los registros de ChatGPT, y que ninguna de las dos partes vea directamente los originales
Al final no queda más que llevar expertos de cada lado a la corte y librar una batalla de credibilidad
Aun así, ojalá este caso sirva para que la gente tome conciencia de los riesgos de compartir en exceso información personal
En la práctica, según los términos, OpenAI posee y aprovecha esos datos
También cuesta confiar en una comunicación que distorsiona las intenciones del NYT
Piensan que se lo buscó sola
OpenAI no muestra ningún sentido de responsabilidad parecido
Entonces surge la duda de por qué ahora usa la privacidad como escudo
Ese tipo de afirmación suele ser señal de una postura defensiva
Que ahora se preocupe por la privacidad es contradictorio
Técnicamente parece posible, pero probablemente eligió guardarlas en texto plano para hacer análisis internos
Si los empleados pueden acceder, eso resulta aún más incómodo que que las vean los abogados del NYT
Me parece casi igual a que un investigador abra cartas por orden judicial