La respuesta de OpenAI frente a la invasión de privacidad de usuarios por parte de The New York Times

(openai.com)

1 puntos por GN⁺ 2025-11-13 | 1 comentarios | Compartir por WhatsApp

OpenAI considera la protección de los datos de conversaciones privadas de ChatGPT, usado por más de 800 millones de personas, como su máxima prioridad
The New York Times pidió ante el tribunal la entrega de 20 millones de registros de conversaciones privadas de ChatGPT, algo señalado como una vulneración de la privacidad de los usuarios
OpenAI ya había rechazado antes una solicitud de 1,400 millones de registros de conversaciones y, en esta ocasión, también sigue impulsando la protección de los datos de los usuarios por la vía legal
La empresa está desarrollando funciones de seguridad reforzadas, como el cifrado del lado del cliente, y construyendo sistemas automatizados que minimizan el acceso a datos sensibles
Este caso es visto como un punto de inflexión importante en torno a los estándares de protección de datos personales en la era de la IA

La solicitud de datos de The New York Times y la postura de OpenAI

The New York Times solicitó, como parte de su demanda contra OpenAI, la entrega de 20 millones de registros de conversaciones de usuarios de ChatGPT
- Afirmó que lo hacía para “verificar si los usuarios utilizaron ChatGPT para evadir el paywall de The New York Times”
OpenAI señaló que esta solicitud viola principios de protección de privacidad y prácticas de seguridad mantenidos durante largo tiempo
La empresa pidió al tribunal que rechazara esta solicitud, al indicar que “incluye conversaciones privadas de decenas de millones de personas no relacionadas con esta demanda”

Solicitudes similares en el pasado y la respuesta

The New York Times ya había intentado antes limitar la función de borrado de conversaciones de los usuarios, pero OpenAI lo impidió y restableció el derecho de eliminación
Después hubo una solicitud para entregar 1,400 millones de registros de conversaciones, pero OpenAI la rechazó
OpenAI afirmó que “las conversaciones privadas de los usuarios pertenecen a las personas y no deben convertirse en víctimas colaterales de disputas sobre acceso a contenido en línea”

Medidas de OpenAI para reforzar seguridad y privacidad

OpenAI, una de las organizaciones más atacadas del mundo, está realizando grandes inversiones para proteger los datos frente al crimen organizado y los intentos de hackeo respaldados por Estados
Su hoja de ruta futura incluye la función de cifrado del lado del cliente (client-side encryption), con la que ni siquiera OpenAI podrá acceder a los mensajes de los usuarios
También está diseñando un sistema automatizado de detección de seguridad para que solo los casos graves de uso indebido —como amenazas a la vida, daños a terceros o riesgos de ciberseguridad— sean enviados de forma limitada a equipos humanos de revisión

Detalles sobre la solicitud de datos (resumen del FAQ)

Alcance de los datos solicitados: 20 millones de conversaciones de consumidores de ChatGPT seleccionadas aleatoriamente entre diciembre de 2022 y noviembre de 2024
Casos excluidos del impacto: no aplica a ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (antes Team) ni a clientes de API
Medidas de protección de privacidad: todas las conversaciones pasan por un proceso de eliminación de información de identificación personal (PII) y de datos sensibles como contraseñas
Permisos de acceso a los datos: solo podrán acceder parte del personal de los equipos legal y de seguridad de OpenAI, además de abogados externos y asesores técnicos del lado de The New York Times
Forma de resguardo: almacenamiento aislado dentro de un sistema de seguridad separado para cumplir con obligaciones legales, sin acceso general

Consideraciones legales e internacionales

OpenAI indicó que está tomando las medidas necesarias para cumplir con regulaciones internacionales de privacidad como el GDPR, pero que la solicitud de The New York Times no se ajusta a sus propios estándares de privacidad
La empresa sigue impugnando la solicitud por la vía legal y mantendrá en todo momento la protección de la privacidad de los usuarios como máxima prioridad
OpenAI prometió ofrecer actualizaciones transparentes sobre futuras decisiones judiciales y cambios en el manejo de datos

Planes y visión a futuro

OpenAI enfatizó que, mientras más se integre la IA en la vida de las personas, más deben fortalecerse la seguridad y la protección de la privacidad
Su objetivo es un futuro en el que las conversaciones de IA más personales de los usuarios permanezcan seguras y privadas
A corto plazo, planea publicar rápidamente medidas de refuerzo de seguridad y mitigaciones temporales
A largo plazo, está impulsando el establecimiento de marcos técnicos y legales de protección para construir un entorno de IA confiable

1 comentarios

GN⁺ 2025-11-13

Opiniones en Hacker News

Se supo que The New York Times exigió a OpenAI entregar 20 millones de registros de conversaciones de ChatGPT
Como demandante, es una solicitud que naturalmente puede hacer, pero este tipo de litigios quizá no se limite solo al tema de derechos de autor
Más bien, el problema es por qué OpenAI está recolectando y conservando tanta información privada de conversaciones
La solicitud del NYT solo se usa dentro del proceso legal, la información confidencial se entrega con partes ocultas y se destruye cuando termina el litigio
En cambio, OpenAI conserva los datos indefinidamente para beneficio comercial
Ni siquiera está claro para qué modelo de negocio acumula estos datos. Me parece una recolección indiscriminada de datos
- En realidad, lo que ordenó el tribunal no fue “recolectar” datos, sino preservar (preserve) datos que ya estaban almacenados
  Documentos relacionados: orden judicial 1, orden judicial 2
- Pero otra persona afirma que esto en realidad es una orden judicial que obliga a recolectar datos
  Ver el artículo de Ars Technica
- La razón por la que OpenAI guarda las conversaciones es clara. Es porque ofrece la función de historial de conversaciones en la interfaz de ChatGPT
  El problema es que, aunque el usuario presione el botón de borrar, los datos deben mantenerse por la orden judicial
- Así como Google Photos guarda fotos, ChatGPT también tiene que guardar el historial de conversaciones. Es una función central del producto
- Si has usado ChatGPT, sabrás que en el panel izquierdo aparece el historial de conversaciones
Si OpenAI no hubiera usado los datos del NYT sin autorización, esto no habría pasado
Al final, creo que la causa de fondo es la infracción de derechos de autor. Está bien que el NYT esté peleando esto
- Pero otra persona responde que dos jueces ya dictaminaron que el entrenamiento de IA es uso justo (fair use)
  Resumen de los fallos relacionados
- También hay quien opina que los datos deberían tratarse como un bien público. Considera problemático que una empresa específica reclame propiedad sobre los datos
- Critican al NYT por contaminar internet con un paywall cerrado
  Piensan que es hipócrita llamar la atención sin contribuir a la cultura abierta
- Critican a Sam Altman y a la dirección de OpenAI por difundir miedo, incertidumbre y duda (FUD) solo para atraer inversión
  Se indignan diciendo que las promesas sobre AGI eran falsas y que solo hicieron sentir ansiedad a la gente
No creo que OpenAI sea “el lado bueno”
Pero me incomoda que conversaciones privadas de la gente terminen en manos de los abogados del NYT
Como el NYT no ha podido demostrar un daño claro, esto parece una fishing expedition
- Sin embargo, otra persona explica que el NYT sí presentó pruebas de robo de contenido, y que para verificarlo se necesitan los registros completos
  Lo compara con pedir los registros de ventas de una librería de copias pirata
  Dice que legalmente es difícil que los usuarios puedan reclamar un derecho de privacidad
- Otra persona explica que el NYT está reclamando daños legales definidos por ley (statutorily defined damages), así que no hace falta probar un perjuicio real
  La clave es si el entrenamiento de IA constituye infracción de copyright y si entra o no en fair use
  También señala que OpenAI respondió de forma poco diligente durante el litigio
- Rechazan la afirmación de que “el NYT no pudo demostrar daños” y dicen que se lea la demanda (complaint) real
  PDF de la demanda del NYT
- Alguien cree que esta pelea terminará beneficiando a China y a los modelos open source
  Los que puedan ignorar el copyright terminarán con ventaja competitiva
- En realidad, la mayoría de los términos de servicio dicen que los registros pueden entregarse por orden judicial
  Solo que casi nadie los leyó
Parece que últimamente está de moda que las empresas publiquen cartas abiertas para pelear la batalla de la opinión pública
ESPN vs YouTube, y ahora OpenAI vs NYT
No me dan ganas de apoyar a ninguno de los dos. Aun así, si OpenAI de verdad no reproduce literalmente frases del NYT, no debería tener por qué temer una verificación
Propongo una verificación neutral por un tercero: que un tercero compare los artículos del NYT con los registros de ChatGPT, y que ninguna de las dos partes vea directamente los originales
- Pero en la práctica es imposible encontrar una entidad totalmente neutral
  Al final no queda más que llevar expertos de cada lado a la corte y librar una batalla de credibilidad
- Alguien más responde con cinismo que ambas organizaciones están bajo liderazgos autoritarios, así que mejor dejarlas pelear
OpenAI empezó como una organización sin fines de lucro, pero ahora parece estar haciendo una campaña de relaciones públicas (spin) completamente desvirtuada
Como cuando Google habla de privacidad, lo que dice OpenAI tampoco transmite ninguna sinceridad
Aun así, ojalá este caso sirva para que la gente tome conciencia de los riesgos de compartir en exceso información personal
- La frase “tus datos son tuyos” suena a propaganda
  En la práctica, según los términos, OpenAI posee y aprovecha esos datos
  También cuesta confiar en una comunicación que distorsiona las intenciones del NYT
- Esta situación ocurrió porque OpenAI se dedicó a raspar indiscriminadamente datos de todo el mundo
  Piensan que se lo buscó sola
- Irónicamente, Google en el pasado sí reconoció el problema del historial de ubicación (Local Timeline) y cambió a un esquema de almacenamiento local
  OpenAI no muestra ningún sentido de responsabilidad parecido
- Hay quien dice incluso que sería mejor para el mundo que OpenAI quebrara
No se entiende que OpenAI alegue en la corte “no nos interesan los datos de los usuarios”
Entonces surge la duda de por qué ahora usa la privacidad como escudo
Desde el momento en que dicen “esta demanda no tiene fundamento”, la credibilidad cae
Ese tipo de afirmación suele ser señal de una postura defensiva
Irónicamente, OpenAI es una empresa que desde el principio raspó información personal para entrenar sus modelos
Que ahora se preocupe por la privacidad es contradictorio
Me pregunto por qué OpenAI no aplica cifrado (encryption) cuando almacena las conversaciones
Técnicamente parece posible, pero probablemente eligió guardarlas en texto plano para hacer análisis internos
Si los empleados pueden acceder, eso resulta aún más incómodo que que las vean los abogados del NYT
Me parece casi igual a que un investigador abra cartas por orden judicial
- Pero en realidad, probablemente no vuelvan a meter la conversación completa en el modelo en cada solicitud, sino que continúen de forma eficiente usando un sistema de caché K-V
- Además, aunque haya cifrado, si OpenAI tiene la llave no puede evitar una orden judicial

La respuesta de OpenAI frente a la invasión de privacidad de usuarios por parte de The New York Times

La solicitud de datos de The New York Times y la postura de OpenAI

Solicitudes similares en el pasado y la respuesta

Medidas de OpenAI para reforzar seguridad y privacidad

Detalles sobre la solicitud de datos (resumen del FAQ)

Consideraciones legales e internacionales

Planes y visión a futuro

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News