OpenAI incorpora la marca de agua SynthID de Google en imágenes de IA junto con una herramienta de verificación
(openai.com)- OpenAI está reforzando un modelo de procedencia en capas para identificar contenido generado por IA, combinando conformidad con C2PA, marca de agua SynthID y una herramienta pública de verificación
- C2PA permite que el contexto de creación y edición del contenido viaje junto con él mediante metadatos y firmas criptográficas, pero puede dañarse durante transformaciones
- SynthID de Google DeepMind agrega una marca de agua invisible a las imágenes generadas en ChatGPT, Codex y la API de OpenAI para complementar las debilidades de los metadatos
- La vista previa de la herramienta pública de verificación ayuda a determinar si una imagen fue generada por OpenAI al revisar Content Credentials y SynthID en la imagen subida
- Una sola tecnología no basta; el ecosistema de procedencia se fortalece al combinar estándares comunes, marcas de agua persistentes y verificación pública
Reforzando el enfoque de procedencia del contenido
- OpenAI está fortaleciendo un modelo de procedencia multinivel para construir confianza en línea, y busca mejorar la identificación de contenido generado por IA con base en estándares abiertos y colaboración entre plataformas
- Hay tres cambios principales
- La conformidad con C2PA ayuda a que otras herramientas y plataformas reconozcan con mayor facilidad las señales de procedencia
- En colaboración con Google, se añade marca de agua SynthID a las imágenes
- Se ofrece una vista previa de una herramienta pública de verificación para que el público pueda confirmar si una imagen fue generada por OpenAI
- Las señales de procedencia proporcionan el contexto necesario para evaluar de dónde proviene un contenido, cómo fue generado o editado, y si coincide con lo que afirma ser
Un ecosistema de confianza mediante la conformidad con C2PA
- OpenAI ha participado desde 2024 en el desarrollo y la adopción de estándares de procedencia, y comenzó a agregar Content Credentials a las imágenes generadas con DALL·E 3
- Después, Content Credentials también se aplicó a ImageGen y Sora
- OpenAI se unió al comité directivo de la Coalition for Content Provenance and Authenticity (C2PA), un grupo interindustrial que impulsa estándares tecnológicos abiertos para la procedencia del contenido
- C2PA funciona usando metadatos y firmas criptográficas para ayudar a que la información relacionada con un medio viaje de forma segura junto con el contenido mismo
- Esta información aporta contexto a periodistas que evalúan procedencia, a plataformas que toman decisiones sobre integridad y a personas que buscan entender el contenido en línea
- OpenAI se convirtió recientemente en un producto generativo conforme con C2PA
- La conformidad con C2PA sirve como base para que las plataformas puedan leer, conservar y transmitir de manera confiable la información de procedencia adjunta al contenido
- La información de procedencia cobra más valor cuando se mantiene más allá de la plataforma donde el contenido fue creado originalmente, y el cumplimiento de conformidad hace posible eso
Procedencia de imágenes en capas con SynthID
- Los metadatos de C2PA son la base que permite transportar información sobre de dónde viene un contenido, cómo fue generado o editado y quién firmó esa información
- Los metadatos pueden eliminarse, perderse durante procesos de subida o descarga, o dañarse por transformaciones como cambios de formato, redimensionado o capturas de pantalla
- Para hacer más robusta la información de procedencia, OpenAI incorpora una marca de agua invisible mediante SynthID de Google DeepMind
- La aplicación comenzará primero con imágenes generadas a través de ChatGPT, Codex y la API de OpenAI
- SynthID funciona como una capa adicional de marca de agua que complementa el enfoque basado en metadatos de C2PA
- OpenAI ya había probado antes enfoques de procedencia y marcas de agua en despliegues reales
- Sora usa marca de agua visible
- Voice Engine usa marca de agua de audio
- La empresa sigue probando e investigando si la precisión y la confiabilidad se mantienen con el tiempo
- C2PA y SynthID compensan debilidades distintas entre sí
- C2PA ayuda a incorporar contexto detallado al contenido, pero los metadatos pueden eliminarse o dañarse
- SynthID ayuda a preservar la señal incluso cuando los metadatos no se conservan, y puede resistir mejor transformaciones como capturas de pantalla
- Los metadatos brindan más información que la que una marca de agua por sí sola puede ofrecer
- Usar ambos enfoques juntos hace que la información de procedencia del contenido sea más resiliente que usar cada uno por separado
Vista previa de la herramienta pública de verificación
- OpenAI ofrece en versión preliminar una herramienta pública de verificación para ayudar a confirmar si una imagen fue generada en ChatGPT, la API de OpenAI o Codex
- La herramienta revisa si la imagen subida incluye señales de procedencia como Content Credentials y SynthID
- El objetivo es integrar múltiples señales para ayudar a los usuarios a verificar e interpretar con mayor facilidad la información de procedencia del contenido
- La herramienta pública de verificación puede detectar de manera confiable marcas de agua SynthID originadas en OpenAI, y también puede mostrar metadatos C2PA si los encuentra
- Como ningún método de detección es perfecto, no emite conclusiones tajantes cuando la detección falla
- Aunque no se detecten metadatos o marca de agua, eso no significa de forma concluyente que la imagen no haya sido generada con herramientas de OpenAI
- Las señales de procedencia pueden eliminarse en algunos casos
- En su lanzamiento, la herramienta de verificación está limitada a contenido generado por OpenAI
- En los próximos meses, el objetivo es apoyar esfuerzos interindustriales que permitan la verificación en distintas plataformas
- Con el tiempo, se espera que también pueda dar soporte a más tipos de contenido disponibles en línea
Retos a futuro
- Una sola tecnología de procedencia no es suficiente
- Un enfoque sólido de procedencia debe combinar estándares comunes, señales de marca de agua duraderas y verificación pública
- OpenAI busca contribuir a un ecosistema de procedencia más interoperable mediante su soporte existente para Content Credentials, su conformidad con C2PA, la adopción de SynthID y la vista previa de la herramienta pública de verificación
1 comentarios
Opiniones de Hacker News
Si haces que una imagen de IA tenga un fondo negro, SynthID se ve en un monitor decente. No es nada especial, solo un patrón borroso repetitivo
Lo quité bastante bien enmascarando cada segundo píxel, regenerando los píxeles faltantes y luego repitiendo el proceso con un desfase de 1 píxel para volver a enmascarar cada segundo píxel
Para rellenar los píxeles usé un modelo ya existente, pero antes exporté primero el mapa de profundidad y reduje el ruido para que los nuevos píxeles enmascarados coincidieran con el contenido original. El resultado no fue 100% perfecto, pero con más tiempo y un modelo ajustado finamente para este propósito, parece que cualquier watermarking de IA se puede quitar sin mucho problema
https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
¿Qué información va en los metadatos o en SynthID? ¿Cuántos bits se pueden codificar en SynthID?
¿Se podría hacer algo como una etiqueta nutricional para contenido sintético? Tipo 10% texto sintético, 30% imagen sintética
Hoy tu realidad fue 15% sintética (75% megacorporación, 25% neocloud de pesos abiertos)
La versión desplegada en producción seguramente es bastante distinta
[0]:https://arxiv.org/html/2510.09263v1
SynthID parece estar completamente comprometido, así que es interesante que el nuevo watermark de OpenAI aparentemente todavía no lo esté [1]
[1] https://github.com/wiltodelta/remove-ai-watermarks
Esto es puro teatro inútil
Desde la perspectiva de alguien que crea cosas con herramientas en distintos medios, simplemente evitaría herramientas así que meten metadatos arbitrarios que yo no elegí
¿Tengo que meter este raro residuo de DRM al crear texturas para videojuegos? ¿Y por qué Photoshop sería la excepción si existe desde hace tanto?
Photoshop no lo hicieron Google ni OpenAI, y la barrera de entrada para hacer imágenes engañosas fotorrealistas con Photoshop es mucho más alta que con IA. Ya existen técnicas para detectar, aunque imperfectamente, el uso de edición de imagen tradicional
SynthID solo sería DRM si Google u OpenAI estuvieran reclamando propiedad intelectual sobre sus imágenes, y no sé si eso sería legal
Bien. Todos dicen que lo van a quitar, pero todavía no he visto un repositorio que lo demuestre de forma reproducible
Lo probé el día que salió Nano Banana Pro y funcionó. Todavía funciona en Nano Banana 2
Arrogantemente no lo publiqué en ningún lado porque pensé que decirlo en público empeoraría internet. Pero si a mí se me ocurrió el primer día, claramente también se le ocurrió a millones de otros programadores, así que fue pura arrogancia
Eso sí, deja artefactos típicos de los modelos SD, y eso podría detectarse por otros medios. O quizá se note al ampliar mucho y mirar con detalle
Es una coincidencia perfecta que este post esté justo al lado de este otro: https://news.ycombinator.com/item?id=48200569
¿Es como los metadatos de un mp3?
Si le tomas una captura de pantalla a una imagen de IA, ¿también parece imagen de IA? Me pregunto si está oculto dentro de la imagen o si es metadato
Primero verificarán si la foto salió de OpenAI, y después le meterán datos del suscriptor y geolocalización
Al final se darán cuenta de que nadie quiere ver fotos o texto generados por IA. Entonces esta herramienta fracasará para el público y solo funcionará para gobiernos
¿No son fáciles de quitar o distorsionar estos watermarks? Parecen útiles solo mientras la gente dependa de ellos rara vez y no valga la pena evadirlos
Si las plataformas de redes sociales empiezan a prohibir imágenes con estos watermarks, parecería que desaparecerían de la noche a la mañana
Los métodos que he visto hasta ahora son solo trucos raros que usan transparencia o superposición de la imagen original al usar funciones de edición, o regenerar con un modelo de difusión una imagen generada por NB a bajo nivel de ruido, lo cual también cambia el original
https://github.com/aloshdenny/reverse-SynthID
Parece inferior al estándar público real C2PA: https://contentauthenticity.org/