1 puntos por GN⁺ 2025-11-13 | 1 comentarios | Compartir por WhatsApp
  • OpenAI considera la protección de los datos de conversaciones privadas de ChatGPT, usado por más de 800 millones de personas, como su máxima prioridad
  • The New York Times pidió ante el tribunal la entrega de 20 millones de registros de conversaciones privadas de ChatGPT, algo señalado como una vulneración de la privacidad de los usuarios
  • OpenAI ya había rechazado antes una solicitud de 1,400 millones de registros de conversaciones y, en esta ocasión, también sigue impulsando la protección de los datos de los usuarios por la vía legal
  • La empresa está desarrollando funciones de seguridad reforzadas, como el cifrado del lado del cliente, y construyendo sistemas automatizados que minimizan el acceso a datos sensibles
  • Este caso es visto como un punto de inflexión importante en torno a los estándares de protección de datos personales en la era de la IA

La solicitud de datos de The New York Times y la postura de OpenAI

  • The New York Times solicitó, como parte de su demanda contra OpenAI, la entrega de 20 millones de registros de conversaciones de usuarios de ChatGPT
    • Afirmó que lo hacía para “verificar si los usuarios utilizaron ChatGPT para evadir el paywall de The New York Times”
  • OpenAI señaló que esta solicitud viola principios de protección de privacidad y prácticas de seguridad mantenidos durante largo tiempo
  • La empresa pidió al tribunal que rechazara esta solicitud, al indicar que “incluye conversaciones privadas de decenas de millones de personas no relacionadas con esta demanda”

Solicitudes similares en el pasado y la respuesta

  • The New York Times ya había intentado antes limitar la función de borrado de conversaciones de los usuarios, pero OpenAI lo impidió y restableció el derecho de eliminación
  • Después hubo una solicitud para entregar 1,400 millones de registros de conversaciones, pero OpenAI la rechazó
  • OpenAI afirmó que “las conversaciones privadas de los usuarios pertenecen a las personas y no deben convertirse en víctimas colaterales de disputas sobre acceso a contenido en línea”

Medidas de OpenAI para reforzar seguridad y privacidad

  • OpenAI, una de las organizaciones más atacadas del mundo, está realizando grandes inversiones para proteger los datos frente al crimen organizado y los intentos de hackeo respaldados por Estados
  • Su hoja de ruta futura incluye la función de cifrado del lado del cliente (client-side encryption), con la que ni siquiera OpenAI podrá acceder a los mensajes de los usuarios
  • También está diseñando un sistema automatizado de detección de seguridad para que solo los casos graves de uso indebido —como amenazas a la vida, daños a terceros o riesgos de ciberseguridad— sean enviados de forma limitada a equipos humanos de revisión

Detalles sobre la solicitud de datos (resumen del FAQ)

  • Alcance de los datos solicitados: 20 millones de conversaciones de consumidores de ChatGPT seleccionadas aleatoriamente entre diciembre de 2022 y noviembre de 2024
  • Casos excluidos del impacto: no aplica a ChatGPT Enterprise, ChatGPT Edu, ChatGPT Business (antes Team) ni a clientes de API
  • Medidas de protección de privacidad: todas las conversaciones pasan por un proceso de eliminación de información de identificación personal (PII) y de datos sensibles como contraseñas
  • Permisos de acceso a los datos: solo podrán acceder parte del personal de los equipos legal y de seguridad de OpenAI, además de abogados externos y asesores técnicos del lado de The New York Times
  • Forma de resguardo: almacenamiento aislado dentro de un sistema de seguridad separado para cumplir con obligaciones legales, sin acceso general

Consideraciones legales e internacionales

  • OpenAI indicó que está tomando las medidas necesarias para cumplir con regulaciones internacionales de privacidad como el GDPR, pero que la solicitud de The New York Times no se ajusta a sus propios estándares de privacidad
  • La empresa sigue impugnando la solicitud por la vía legal y mantendrá en todo momento la protección de la privacidad de los usuarios como máxima prioridad
  • OpenAI prometió ofrecer actualizaciones transparentes sobre futuras decisiones judiciales y cambios en el manejo de datos

Planes y visión a futuro

  • OpenAI enfatizó que, mientras más se integre la IA en la vida de las personas, más deben fortalecerse la seguridad y la protección de la privacidad
  • Su objetivo es un futuro en el que las conversaciones de IA más personales de los usuarios permanezcan seguras y privadas
  • A corto plazo, planea publicar rápidamente medidas de refuerzo de seguridad y mitigaciones temporales
  • A largo plazo, está impulsando el establecimiento de marcos técnicos y legales de protección para construir un entorno de IA confiable

1 comentarios

 
GN⁺ 2025-11-13
Opiniones en Hacker News
  • Se supo que The New York Times exigió a OpenAI entregar 20 millones de registros de conversaciones de ChatGPT
    Como demandante, es una solicitud que naturalmente puede hacer, pero este tipo de litigios quizá no se limite solo al tema de derechos de autor
    Más bien, el problema es por qué OpenAI está recolectando y conservando tanta información privada de conversaciones
    La solicitud del NYT solo se usa dentro del proceso legal, la información confidencial se entrega con partes ocultas y se destruye cuando termina el litigio
    En cambio, OpenAI conserva los datos indefinidamente para beneficio comercial
    Ni siquiera está claro para qué modelo de negocio acumula estos datos. Me parece una recolección indiscriminada de datos
    • En realidad, lo que ordenó el tribunal no fue “recolectar” datos, sino preservar (preserve) datos que ya estaban almacenados
      Documentos relacionados: orden judicial 1, orden judicial 2
    • Pero otra persona afirma que esto en realidad es una orden judicial que obliga a recolectar datos
      Ver el artículo de Ars Technica
    • La razón por la que OpenAI guarda las conversaciones es clara. Es porque ofrece la función de historial de conversaciones en la interfaz de ChatGPT
      El problema es que, aunque el usuario presione el botón de borrar, los datos deben mantenerse por la orden judicial
    • Así como Google Photos guarda fotos, ChatGPT también tiene que guardar el historial de conversaciones. Es una función central del producto
    • Si has usado ChatGPT, sabrás que en el panel izquierdo aparece el historial de conversaciones
  • Si OpenAI no hubiera usado los datos del NYT sin autorización, esto no habría pasado
    Al final, creo que la causa de fondo es la infracción de derechos de autor. Está bien que el NYT esté peleando esto
    • Pero otra persona responde que dos jueces ya dictaminaron que el entrenamiento de IA es uso justo (fair use)
      Resumen de los fallos relacionados
    • También hay quien opina que los datos deberían tratarse como un bien público. Considera problemático que una empresa específica reclame propiedad sobre los datos
    • Critican al NYT por contaminar internet con un paywall cerrado
      Piensan que es hipócrita llamar la atención sin contribuir a la cultura abierta
    • Critican a Sam Altman y a la dirección de OpenAI por difundir miedo, incertidumbre y duda (FUD) solo para atraer inversión
      Se indignan diciendo que las promesas sobre AGI eran falsas y que solo hicieron sentir ansiedad a la gente
  • No creo que OpenAI sea “el lado bueno”
    Pero me incomoda que conversaciones privadas de la gente terminen en manos de los abogados del NYT
    Como el NYT no ha podido demostrar un daño claro, esto parece una fishing expedition
    • Sin embargo, otra persona explica que el NYT sí presentó pruebas de robo de contenido, y que para verificarlo se necesitan los registros completos
      Lo compara con pedir los registros de ventas de una librería de copias pirata
      Dice que legalmente es difícil que los usuarios puedan reclamar un derecho de privacidad
    • Otra persona explica que el NYT está reclamando daños legales definidos por ley (statutorily defined damages), así que no hace falta probar un perjuicio real
      La clave es si el entrenamiento de IA constituye infracción de copyright y si entra o no en fair use
      También señala que OpenAI respondió de forma poco diligente durante el litigio
    • Rechazan la afirmación de que “el NYT no pudo demostrar daños” y dicen que se lea la demanda (complaint) real
      PDF de la demanda del NYT
    • Alguien cree que esta pelea terminará beneficiando a China y a los modelos open source
      Los que puedan ignorar el copyright terminarán con ventaja competitiva
    • En realidad, la mayoría de los términos de servicio dicen que los registros pueden entregarse por orden judicial
      Solo que casi nadie los leyó
  • Parece que últimamente está de moda que las empresas publiquen cartas abiertas para pelear la batalla de la opinión pública
    ESPN vs YouTube, y ahora OpenAI vs NYT
    No me dan ganas de apoyar a ninguno de los dos. Aun así, si OpenAI de verdad no reproduce literalmente frases del NYT, no debería tener por qué temer una verificación
    Propongo una verificación neutral por un tercero: que un tercero compare los artículos del NYT con los registros de ChatGPT, y que ninguna de las dos partes vea directamente los originales
    • Pero en la práctica es imposible encontrar una entidad totalmente neutral
      Al final no queda más que llevar expertos de cada lado a la corte y librar una batalla de credibilidad
    • Alguien más responde con cinismo que ambas organizaciones están bajo liderazgos autoritarios, así que mejor dejarlas pelear
  • OpenAI empezó como una organización sin fines de lucro, pero ahora parece estar haciendo una campaña de relaciones públicas (spin) completamente desvirtuada
  • Como cuando Google habla de privacidad, lo que dice OpenAI tampoco transmite ninguna sinceridad
    Aun así, ojalá este caso sirva para que la gente tome conciencia de los riesgos de compartir en exceso información personal
    • La frase “tus datos son tuyos” suena a propaganda
      En la práctica, según los términos, OpenAI posee y aprovecha esos datos
      También cuesta confiar en una comunicación que distorsiona las intenciones del NYT
    • Esta situación ocurrió porque OpenAI se dedicó a raspar indiscriminadamente datos de todo el mundo
      Piensan que se lo buscó sola
    • Irónicamente, Google en el pasado sí reconoció el problema del historial de ubicación (Local Timeline) y cambió a un esquema de almacenamiento local
      OpenAI no muestra ningún sentido de responsabilidad parecido
    • Hay quien dice incluso que sería mejor para el mundo que OpenAI quebrara
  • No se entiende que OpenAI alegue en la corte “no nos interesan los datos de los usuarios”
    Entonces surge la duda de por qué ahora usa la privacidad como escudo
  • Desde el momento en que dicen “esta demanda no tiene fundamento”, la credibilidad cae
    Ese tipo de afirmación suele ser señal de una postura defensiva
  • Irónicamente, OpenAI es una empresa que desde el principio raspó información personal para entrenar sus modelos
    Que ahora se preocupe por la privacidad es contradictorio
  • Me pregunto por qué OpenAI no aplica cifrado (encryption) cuando almacena las conversaciones
    Técnicamente parece posible, pero probablemente eligió guardarlas en texto plano para hacer análisis internos
    Si los empleados pueden acceder, eso resulta aún más incómodo que que las vean los abogados del NYT
    Me parece casi igual a que un investigador abra cartas por orden judicial
    • Pero en realidad, probablemente no vuelvan a meter la conversación completa en el modelo en cada solicitud, sino que continúen de forma eficiente usando un sistema de caché K-V
    • Además, aunque haya cifrado, si OpenAI tiene la llave no puede evitar una orden judicial