2 puntos por GN⁺ 2 시간 전 | 1 comentarios | Compartir por WhatsApp
  • OpenAI está reforzando un modelo de procedencia en capas para identificar contenido generado por IA, combinando conformidad con C2PA, marca de agua SynthID y una herramienta pública de verificación
  • C2PA permite que el contexto de creación y edición del contenido viaje junto con él mediante metadatos y firmas criptográficas, pero puede dañarse durante transformaciones
  • SynthID de Google DeepMind agrega una marca de agua invisible a las imágenes generadas en ChatGPT, Codex y la API de OpenAI para complementar las debilidades de los metadatos
  • La vista previa de la herramienta pública de verificación ayuda a determinar si una imagen fue generada por OpenAI al revisar Content Credentials y SynthID en la imagen subida
  • Una sola tecnología no basta; el ecosistema de procedencia se fortalece al combinar estándares comunes, marcas de agua persistentes y verificación pública

Reforzando el enfoque de procedencia del contenido

  • OpenAI está fortaleciendo un modelo de procedencia multinivel para construir confianza en línea, y busca mejorar la identificación de contenido generado por IA con base en estándares abiertos y colaboración entre plataformas
  • Hay tres cambios principales
    • La conformidad con C2PA ayuda a que otras herramientas y plataformas reconozcan con mayor facilidad las señales de procedencia
    • En colaboración con Google, se añade marca de agua SynthID a las imágenes
    • Se ofrece una vista previa de una herramienta pública de verificación para que el público pueda confirmar si una imagen fue generada por OpenAI
  • Las señales de procedencia proporcionan el contexto necesario para evaluar de dónde proviene un contenido, cómo fue generado o editado, y si coincide con lo que afirma ser

Un ecosistema de confianza mediante la conformidad con C2PA

  • OpenAI ha participado desde 2024 en el desarrollo y la adopción de estándares de procedencia, y comenzó a agregar Content Credentials a las imágenes generadas con DALL·E 3
  • Después, Content Credentials también se aplicó a ImageGen y Sora
  • OpenAI se unió al comité directivo de la Coalition for Content Provenance and Authenticity (C2PA), un grupo interindustrial que impulsa estándares tecnológicos abiertos para la procedencia del contenido
  • C2PA funciona usando metadatos y firmas criptográficas para ayudar a que la información relacionada con un medio viaje de forma segura junto con el contenido mismo
  • Esta información aporta contexto a periodistas que evalúan procedencia, a plataformas que toman decisiones sobre integridad y a personas que buscan entender el contenido en línea
  • OpenAI se convirtió recientemente en un producto generativo conforme con C2PA
  • La conformidad con C2PA sirve como base para que las plataformas puedan leer, conservar y transmitir de manera confiable la información de procedencia adjunta al contenido
  • La información de procedencia cobra más valor cuando se mantiene más allá de la plataforma donde el contenido fue creado originalmente, y el cumplimiento de conformidad hace posible eso

Procedencia de imágenes en capas con SynthID

  • Los metadatos de C2PA son la base que permite transportar información sobre de dónde viene un contenido, cómo fue generado o editado y quién firmó esa información
  • Los metadatos pueden eliminarse, perderse durante procesos de subida o descarga, o dañarse por transformaciones como cambios de formato, redimensionado o capturas de pantalla
  • Para hacer más robusta la información de procedencia, OpenAI incorpora una marca de agua invisible mediante SynthID de Google DeepMind
  • La aplicación comenzará primero con imágenes generadas a través de ChatGPT, Codex y la API de OpenAI
  • SynthID funciona como una capa adicional de marca de agua que complementa el enfoque basado en metadatos de C2PA
  • OpenAI ya había probado antes enfoques de procedencia y marcas de agua en despliegues reales
    • Sora usa marca de agua visible
    • Voice Engine usa marca de agua de audio
    • La empresa sigue probando e investigando si la precisión y la confiabilidad se mantienen con el tiempo
  • C2PA y SynthID compensan debilidades distintas entre sí
    • C2PA ayuda a incorporar contexto detallado al contenido, pero los metadatos pueden eliminarse o dañarse
    • SynthID ayuda a preservar la señal incluso cuando los metadatos no se conservan, y puede resistir mejor transformaciones como capturas de pantalla
    • Los metadatos brindan más información que la que una marca de agua por sí sola puede ofrecer
  • Usar ambos enfoques juntos hace que la información de procedencia del contenido sea más resiliente que usar cada uno por separado

Vista previa de la herramienta pública de verificación

  • OpenAI ofrece en versión preliminar una herramienta pública de verificación para ayudar a confirmar si una imagen fue generada en ChatGPT, la API de OpenAI o Codex
  • La herramienta revisa si la imagen subida incluye señales de procedencia como Content Credentials y SynthID
  • El objetivo es integrar múltiples señales para ayudar a los usuarios a verificar e interpretar con mayor facilidad la información de procedencia del contenido
  • La herramienta pública de verificación puede detectar de manera confiable marcas de agua SynthID originadas en OpenAI, y también puede mostrar metadatos C2PA si los encuentra
  • Como ningún método de detección es perfecto, no emite conclusiones tajantes cuando la detección falla
    • Aunque no se detecten metadatos o marca de agua, eso no significa de forma concluyente que la imagen no haya sido generada con herramientas de OpenAI
    • Las señales de procedencia pueden eliminarse en algunos casos
  • En su lanzamiento, la herramienta de verificación está limitada a contenido generado por OpenAI
  • En los próximos meses, el objetivo es apoyar esfuerzos interindustriales que permitan la verificación en distintas plataformas
  • Con el tiempo, se espera que también pueda dar soporte a más tipos de contenido disponibles en línea

Retos a futuro

  • Una sola tecnología de procedencia no es suficiente
  • Un enfoque sólido de procedencia debe combinar estándares comunes, señales de marca de agua duraderas y verificación pública
  • OpenAI busca contribuir a un ecosistema de procedencia más interoperable mediante su soporte existente para Content Credentials, su conformidad con C2PA, la adopción de SynthID y la vista previa de la herramienta pública de verificación

1 comentarios

 
GN⁺ 2 시간 전
Opiniones de Hacker News
  • Si haces que una imagen de IA tenga un fondo negro, SynthID se ve en un monitor decente. No es nada especial, solo un patrón borroso repetitivo
    Lo quité bastante bien enmascarando cada segundo píxel, regenerando los píxeles faltantes y luego repitiendo el proceso con un desfase de 1 píxel para volver a enmascarar cada segundo píxel
    Para rellenar los píxeles usé un modelo ya existente, pero antes exporté primero el mapa de profundidad y reduje el ruido para que los nuevos píxeles enmascarados coincidieran con el contenido original. El resultado no fue 100% perfecto, pero con más tiempo y un modelo ajustado finamente para este propósito, parece que cualquier watermarking de IA se puede quitar sin mucho problema

    • Me cuesta creer que se pueda eliminar un watermark de 0.5 bits que solo codifica si está o no presente. Lo visible probablemente sea un señuelo funcional
    • ¿No bastaría con estirar o comprimir la imagen apenas un poco?
    • Es interesante eso de que, con más tiempo y un modelo ajustado finamente para un uso específico, cualquier watermarking de IA podría eliminarse sin mucho problema. Usar IA contra IA siempre es divertido
    • Definitivamente se puede evadir. Algunos de nuestros ingenieros ya trabajaron en esto hace tiempo
      https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
  • ¿Qué información va en los metadatos o en SynthID? ¿Cuántos bits se pueden codificar en SynthID?
    ¿Se podría hacer algo como una etiqueta nutricional para contenido sintético? Tipo 10% texto sintético, 30% imagen sintética
    Hoy tu realidad fue 15% sintética (75% megacorporación, 25% neocloud de pesos abiertos)

    • El paper de SynthID-Image de octubre de 2025[0] parecía ser un codificador-decodificador que probaba verificación de bandera o una carga útil de 136 bits en imágenes de 512x512, y evaluaba la robustez del watermark después de varias transformaciones
      La versión desplegada en producción seguramente es bastante distinta
      [0]:https://arxiv.org/html/2510.09263v1
    • También podrían meter un ID de usuario o una huella digital por persona. Hace mucho que las impresoras ya hacían eso, y ahora también podría hacerse fácilmente con cada foto e imagen que se genere
    • Eso probablemente no se puede. Si pegas partes sintéticas sobre una imagen original, SynthID no tendría forma de saberlo
  • SynthID parece estar completamente comprometido, así que es interesante que el nuevo watermark de OpenAI aparentemente todavía no lo esté [1]
    [1] https://github.com/wiltodelta/remove-ai-watermarks

  • Esto es puro teatro inútil
    Desde la perspectiva de alguien que crea cosas con herramientas en distintos medios, simplemente evitaría herramientas así que meten metadatos arbitrarios que yo no elegí
    ¿Tengo que meter este raro residuo de DRM al crear texturas para videojuegos? ¿Y por qué Photoshop sería la excepción si existe desde hace tanto?

    • Que no sea perfecto no significa que sea inútil. Ya vi publicaciones online donde alguien pasó una imagen por el verificador de SynthID de Google para demostrar que era falsa
      Photoshop no lo hicieron Google ni OpenAI, y la barrera de entrada para hacer imágenes engañosas fotorrealistas con Photoshop es mucho más alta que con IA. Ya existen técnicas para detectar, aunque imperfectamente, el uso de edición de imagen tradicional
    • Creo que se pueden pensar fácilmente varios factores que distinguen Photoshop de la IA generativa
    • Estrictamente hablando, DRM es gestión de derechos digitales y tiene que ver con propiedad intelectual
      SynthID solo sería DRM si Google u OpenAI estuvieran reclamando propiedad intelectual sobre sus imágenes, y no sé si eso sería legal
    • Como referencia: https://en.wikipedia.org/wiki/Printer_tracking_dots
    • ¿Cómo se compara hoy la máxima tasa teórica de producción de desinformación por minuto con la de Photoshop en 2021?
  • Bien. Todos dicen que lo van a quitar, pero todavía no he visto un repositorio que lo demuestre de forma reproducible

    • En Stable Diffusion, con una intensidad de denoise de 10~15% ya queda
      Lo probé el día que salió Nano Banana Pro y funcionó. Todavía funciona en Nano Banana 2
      Arrogantemente no lo publiqué en ningún lado porque pensé que decirlo en público empeoraría internet. Pero si a mí se me ocurrió el primer día, claramente también se le ocurrió a millones de otros programadores, así que fue pura arrogancia
      Eso sí, deja artefactos típicos de los modelos SD, y eso podría detectarse por otros medios. O quizá se note al ampliar mucho y mirar con detalle
    • Desde el inicio parecería mucho más fácil usar simplemente otro modelo
    • Sí lo van a quitar, pero mucha gente no lo hará. De hecho sí he visto desinformación detectable con SynthID
  • Es una coincidencia perfecta que este post esté justo al lado de este otro: https://news.ycombinator.com/item?id=48200569

  • ¿Es como los metadatos de un mp3?
    Si le tomas una captura de pantalla a una imagen de IA, ¿también parece imagen de IA? Me pregunto si está oculto dentro de la imagen o si es metadato

    • Está dentro de la imagen, y está diseñado para sobrevivir a ese tipo de procesos
  • Primero verificarán si la foto salió de OpenAI, y después le meterán datos del suscriptor y geolocalización
    Al final se darán cuenta de que nadie quiere ver fotos o texto generados por IA. Entonces esta herramienta fracasará para el público y solo funcionará para gobiernos

    • El único uso de la generación por IA fotorrealista parece ser el engaño. Ya se están usando videos generados por IA en anuncios políticos en Estados Unidos
  • ¿No son fáciles de quitar o distorsionar estos watermarks? Parecen útiles solo mientras la gente dependa de ellos rara vez y no valga la pena evadirlos
    Si las plataformas de redes sociales empiezan a prohibir imágenes con estos watermarks, parecería que desaparecerían de la noche a la mañana

    • No. Son muy resistentes a transformaciones fáciles de hacer. Eso no significa que yo crea que sea imposible
    • Hasta ahora no he visto ni un solo repositorio de GitHub que elimine un watermark real de SynthID de salidas reales de Nano Banana 2/NBPro. La mayoría todavía son proyectos de investigación sin resultados
      Los métodos que he visto hasta ahora son solo trucos raros que usan transparencia o superposición de la imagen original al usar funciones de edición, o regenerar con un modelo de difusión una imagen generada por NB a bajo nivel de ruido, lo cual también cambia el original
    • Hace falta definir “fácilmente”. Hay un enfoque basado en análisis espectral de la imagen y, en apariencia, funciona
      https://github.com/aloshdenny/reverse-SynthID
    • Esto se publicó hace años y al parecer todavía no lo han roto. Algún día lo romperán, pero si para hacer un deepfake y subirlo a Facebook tienes que esperar 1 o 2 años, quizá con eso ya basta. Incluso un retraso de un mes podría ser suficiente
    • Parecería posible hacer que una IA reconstruya la imagen desde cero a partir de una descripción muy detallada
  • Parece inferior al estándar público real C2PA: https://contentauthenticity.org/