2 puntos por GN⁺ 2024-05-15 | 1 comentarios | Compartir por WhatsApp

Sir, there's a cat in your mirror dimension

  • Antes habíamos hablado sobre el dominio de la frecuencia.

    • Es una técnica para convertir una señal cotidiana en las amplitudes de las formas de onda que la componen.
    • La base más común es una onda sinusoidal de frecuencia creciente.
    • Muchas otras formas de onda también pueden crear distintos dominios de frecuencia.
  • Dos propiedades importantes de la transformación al dominio de la frecuencia:

    • Reversibilidad: se pueden restaurar los datos originales a partir de la imagen de frecuencia.
    • Simetría de entrada y salida: es posible transformar en ambas direcciones usando la misma operación matemática.
  • En la práctica, esta distinción importa.

    • Es especialmente importante en compresión.
    • Si conviertes una imagen al dominio de la frecuencia y reduces la precisión de los componentes de alta frecuencia, disminuye la cantidad de datos.
    • La imagen resultante sigue viéndose igual a simple vista.

Usar MS Paint como herramienta de compresión de última generación

  • Una imagen en el dominio de la frecuencia parece ruido disperso.

    • La mayor parte no es visualmente importante.
    • La transformación es una palanca que va y viene entre dos dimensiones funcionalmente equivalentes.
    • Surgió la duda de si sería posible usar esta dimensión espejo como hogar y mover parte de los datos allí.
  • Para probarlo, se tomó una foto de un gato y se calculó su forma en el dominio de la frecuencia con la transformada discreta del coseno (DCT).

    • Gato en el tiempo, gato en la frecuencia.
  • Luego se usó la foto de la mujer del ejemplo anterior y se superpuso el patrón de "ruido de gato" de la dimensión espejo, bajando la opacidad.

    • Mujer en el tiempo y gato en la frecuencia.
  • La composición inevitablemente introduce pérdidas.

    • En teoría, si se calcula la representación en el dominio de la frecuencia de la imagen compuesta mediante DCT, la foto de la mujer se descompondría en ruido uniforme.
    • El "ruido de gato" inyectado se condensaría en una imagen reconocible del gato.
  • En la práctica, eso es exactamente lo que ocurre.

    • Gato en la frecuencia y mujer en el tiempo.
  • Si quieres comprobarlo tú mismo, puedes descargar la imagen compuesta y ejecutar lo siguiente en MATLAB:

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • Curiosamente, el gato sobrevive incluso al cambio de tamaño del documento anfitrión.

    • Al escalar hacia arriba, la imagen se mosaica.
    • Al escalar hacia abajo, la imagen se recorta.
  • También surgió la pregunta de cuánto dañaría al gato la compresión con pérdida.

    • El impacto fue menor de lo esperado.
    • Con una configuración alta de calidad JPEG, la imagen se ve bastante bien.
    • Cuando baja la calidad, el cuadrante inferior derecho queda fuertemente cuantizado.
    • El caos de la compresión JPEG visto desde el dominio de la frecuencia.
  • Esta visualización muestra cuánta información destruye el algoritmo JPEG.

    • La mayor parte es algo que ni siquiera notamos.
  • Ya hay muchos casos previos de espectrogramas de audio usados como mensajes ocultos.

    • También hay debates sobre esteganografía de texto usando coeficientes DCT de JPEG.
    • Más que decir que esta técnica sea especialmente útil, el punto es destacar la divertida conexión entre el dominio de la frecuencia y el dominio temporal.

La opinión de GN⁺

  1. Entender la transformación al dominio de la frecuencia: las transformaciones al dominio de la frecuencia cumplen un papel importante en la compresión de datos y el procesamiento de señales. Entenderlas ayuda a procesar imágenes o audio de forma eficiente.
  2. Uso de MATLAB: MATLAB es una herramienta poderosa para análisis y visualización de datos. Este artículo permite ver un ejemplo práctico de su uso.
  3. Límites de la compresión JPEG: se pueden entender visualmente los límites de la compresión JPEG. Eso ayuda a encontrar maneras de reducir el tamaño de archivo manteniendo la calidad de imagen.
  4. Esteganografía: la esteganografía usando el dominio de la frecuencia es un tema interesante relacionado con la seguridad de los datos. Permite aprender formas de transmitir mensajes ocultos.
  5. Aplicaciones divertidas de la tecnología: este artículo muestra cómo aplicar la tecnología de una manera creativa y entretenida. Eso puede aumentar el interés por la tecnología e inspirar nuevas ideas.

1 comentarios

 
GN⁺ 2024-05-15
Opiniones de Hacker News

Resumen de comentarios de Hacker News

  • El tema de la foto y la energía espectral:

    • En la mayoría de las fotos, el sujeto reconocible tiene la energía espectral concentrada en el origen (esquina superior izquierda).
    • El sujeto de la foto normalmente está ubicado en el centro del encuadre, lo que minimiza la interferencia entre los datos de los dominios espacial y de frecuencia.
  • Fundamentos del marcado de agua digital:

    • Esta técnica sirve como base para el marcado de agua digital robusto en señales como imágenes o audio.
    • La aplicación principal es detectar material con derechos de autor incluso después de que la señal haya sido muy procesada.
  • Dualidad tiempo-frecuencia de la transformada de Fourier:

    • El principio matemático de la transformada de Fourier funciona igual sin importar la dirección de la transformación.
    • Si insertas la gráfica de frecuencia del gato en la gráfica espacial de la mujer, la transformada de Fourier de la mujer hace aparecer al gato.
  • Solicitud de confirmación del proceso:

    • Se toma una foto, se convierte el gato al dominio de frecuencia y luego se compone sobre la imagen visual de la mujer.
    • Si se aplica DCT otra vez a la imagen compuesta, aparece el gato.
  • Aplicación en esteganografía:

    • Una aplicación interesante de la esteganografía para ocultar imágenes ilegales.
    • Si se transforma al dominio de frecuencia y se compone en otra imagen, solo quien sabe cómo revertirlo puede ver la imagen.
  • El truco del espectrograma de audio de Aphex Twin:

    • Es similar al divertido truco en el que Aphex Twin hizo aparecer una cara extraña en el espectrograma de audio de una pista.
  • La importancia de la posición en la DCT:

    • Si el gato hubiera estado más concentrado en la esquina superior izquierda, esta demo no habría funcionado bien.
    • La DCT tiene muchos componentes de alta frecuencia, así que si el gato se coloca arriba a la izquierda, es muy probable que quede oculto.
  • Comprensión de la compresión de imágenes:

    • Se reconoce que el dominio de frecuencia puede usarse para la compresión de imágenes.
    • Surge la duda de si la mayoría de los algoritmos de compresión de imágenes funcionan eliminando las partes silenciosas del dominio de frecuencia.
  • Método específico de la DCT:

    • Parece que la DCT se aplicó de una forma distinta a los mosaicos de 8x8 usados en JPEG.
    • Da la impresión de que en este caso no se usaron funciones base de DCT 2D.
  • Codificación de imágenes en música y sonido:

    • Es similar a cómo Aphex Twin y Venetian Snares codificaron imágenes en el sonido.
    • Con ciertas herramientas, se puede ver que las frecuencias muestran la imagen del gato.