- YouTube aplicó tecnología de corrección basada en IA a algunos videos de canales populares sin notificarlo a creadores o espectadores.
- Los youtubers de música Rick Beato y Rhett Shull detectaron cambios sutiles en su contenido, como piel, cabello y pliegues de la ropa, y llamaron la atención sobre ello.
- YouTube afirmó que se trataba de una “prueba limitada a algunos Shorts” y explicó que mejoró la nitidez del video y redujo el ruido mediante machine learning tradicional.
- Sin embargo, expertos criticaron la ambigüedad terminológica y la falta de transparencia, argumentando que “el machine learning también es IA”, y alertaron sobre riesgos para la confiabilidad del contenido.
- Este caso, en el que el contenido se modifica sin consentimiento del creador, se valora como una señal de los problemas de veracidad y confianza en los medios digitales.
Experimento confidencial de mejora de video con IA de YouTube
- YouTube aplicó de forma discreta una tecnología de mejora de video basada en IA a algunos videos de creadores populares
- Sin aviso previo a creadores ni espectadores, modificó elementos visuales del video.
- Rick Beato y Rhett Shull descubrieron que en sus videos cambiaban la textura de la piel, el cabello, los pliegues de la ropa y la forma de las orejas.
- Beato comentó que “el cabello se veía raro y parecía que había maquillaje”.
- Shull señaló que “parecía generado por IA” y advirtió que podría deteriorar la confianza con la audiencia.
Confirmación del experimento y aclaración de YouTube
- YouTube aceptó que está realizando una prueba a pequeña escala en algunos videos de Shorts.
- Rene Ritchie, el Creator Liaison, explicó en X (antiguo Twitter) que se trataba de una “prueba para mejorar la nitidez y el ruido del video usando machine learning tradicional”.
- Aseguró que la prueba era de una intensidad similar a la corrección automática de un smartphone.
- Sin embargo, el profesor Samuel Woolley de la Universidad de Pittsburgh criticó que el enfoque de YouTube era una formulación engañosa, ya que el machine learning es un subconcepto dentro de la IA.
Expansión del preprocesamiento con IA y el problema de la confianza
- Expertos señalan que este caso es parte de la tendencia más amplia de preprocesar contenido con IA.
- Samsung ya usó IA para hacer más nítidas imágenes de la Luna, y Google Pixel con “Best Take” sintetiza varias expresiones faciales para crear una sola foto perfecta.
- Woolley advirtió que lo que YouTube hace al distribuir contenido editado y publicado sin consentimiento del creador implica la aparición de una capa invisible de manipulación entre público y medios.
- Esto conduce a preocupaciones sobre la veracidad del contenido y la transparencia.
Reacciones de creadores y expertos
- Beato mantuvo una actitud positiva ante el intento de YouTube y lo llamó “una plataforma que siempre experimenta con herramientas nuevas”.
- Dijo “YouTube cambió mi vida” y moderó sus críticas.
- En contraste, los críticos señalan que dejar de lado avisos previos deja un precedente peligroso.
- También señalaron que YouTube es una plataforma principal no solo para entretenimiento sino también para noticias, educación y contenidos de información, por lo que la precisión y autenticidad son especialmente importantes.
Hacia el futuro de los medios digitales
- Este caso anticipa un futuro en el que la IA reestructura contenido antes del primer reconocimiento del usuario.
- Muestra que el espectador podría recibir un video con intervención de IA antes de presionar el botón de reproducción.
- Se destaca la necesidad de notificar de forma transparente el uso de IA y establecer procesos de consentimiento de creadores.
1 comentarios
Opiniones de Hacker News
En videos de maquillaje de labios, los labios se ven más grandes, y en videos de maquillaje de ojos, los ojos se ven más grandes; al parecer, la IA detecta el tipo de contenido y aplica filtros automáticamente
El video relacionado se puede ver aquí. Impacta que modifiquen las subidas de los creadores sin permiso
Como la influencer no es técnica, probablemente confundió eso con un filtro de IA. Que bloques de movimiento floten por la pantalla es un fenómeno típico de compresión alta
Es raro que en un foro técnico acepten esta afirmación tal cual. Todo el video carece de detalle y muestra señales claras de compresión
En los términos de uso seguro hay una cláusula que dice que la plataforma puede “hacer lo que quiera”, así que después podrían justificarlo como una “configuración del usuario”
“Cuando Meta hace traducción automática de voz, agrega un filtro de IA para que el movimiento de la boca coincida con el audio, y en ese proceso a veces termina cubriendo toda la cara con un filtro raro”
Decir que aplican filtros distintos según el tipo de contenido suena a una especulación excesiva, casi conspirativa
La piel queda demasiado suave, el cabello parece encerado y aparecen anillos extraños alrededor de objetos en movimiento
Al principio pensé que era escalado del lado del cliente, pero se procesa en el servidor, así que ni siquiera se puede desactivar
Si la gente se acostumbra a esta calidad, después será más difícil notar cuando se mezcle contenido generado por IA
La gente solo hará scroll infinito viendo anuncios y contenido que les derrite el cerebro
ffmpeg -i source.mkv -i suspect.mkv -filter_complex "blend=all_mode=difference" diff_output.mkvHay muchas afirmaciones de este tipo, pero todavía no he visto a nadie subir un video comparativo (diff). Sería interesante que alguien lo hiciera
En este video de YouTube, en el minuto 0:31, muestra Shorts y el original lado a lado
En la versión de alta calidad subida a Patreon, la diferencia se nota mucho más
Últimamente capturo la miniatura y se la pregunto a ChatGPT, o pongo la URL del video en un extractor de transcripciones para analizarlo con Gemini
Los creadores de clickbait ya quedaron reducidos a ser poco más que “quienes sugieren temas para preguntarle a ChatGPT”
No parece inteligente hacer estas “mejoras” sin avisarles a los creadores
Debería haber más gente probando plataformas mejores, aunque sea por los creadores pequeños y medianos que sufren por reclamos falsos de copyright
Como alternativa, existen plataformas como PeerTube en el Fediverse
Aumentar el engagement es tarea del creador; si la plataforma se mete, al final los usuarios terminan yéndose
Hay un ejemplo relacionado en este artículo
La compresión con pérdida y la cuantización adaptativa pueden hacer que la piel se vea más suave
Científicos, políticos, economistas y expertos en tecnología aparecen replicados por IA de pies a cabeza
Artículo relacionado: Reporte de The Guardian
No creo que Google tenga ninguna razón para ofrecer datos limpios al exterior
Por ejemplo, este canal usa una imagen-resumen que parece generada con Stable Diffusion, no un fotograma real del video
La vi una vez en mi canal, pero ahora la opción desapareció. La mayoría de los canales que sigo están usando esta función
Personalmente no me gusta
Por ejemplo, estaría bien poder escribir debajo del video prompts como “cambiar inglés por gaélico”, “reemplazar los chistes de papá por lorem ipsum” o “convertir al perro en una forma de vida alienígena”
Sería genial si pudiera ejecutarse localmente en el navegador, aunque para entonces probablemente ya esté prohibido por ley