DCT y umbral duro


8

Si tengo una imagen y encuentro el DCT y luego aplico un umbral duro en los coeficientes y luego IDCT, entonces he atenuado el ruido. ¿Puede alguien explicarme en detalle o señalarme la respuesta de por qué esto funciona? Entiendo por qué un filtro que bloquea la alta frecuencia funcionará en la eliminación de ruido (porque suponemos que el ruido consiste en componentes de alta frecuencia), pero ¿por qué funciona el umbral de magnitud?

Respuestas:


4

El filtrado de paso bajo se basa en el supuesto de que las imágenes "naturales" tienen más energía en los coeficientes de baja frecuencia que en los coeficientes de alta frecuencia; mientras que el ruido afectará igualmente a todos los coeficientes. Por lo tanto, eliminar los coeficientes de alta frecuencia eliminará comparativamente más ruido que la señal. El problema es que existen coeficientes de alta frecuencia "legítimos" en las imágenes, como los bordes. La eliminación del ruido mediante el filtrado de paso bajo atenuará esos coeficientes y provocará un desenfoque de los bordes.

La propiedad utilizada en el umbral de magnitud es la dispersión : es muy probable que las imágenes "naturales" tengan solo un pequeño conjunto de coeficientes altos distintos de cero en el dominio de la frecuencia. Agregar ruido uniforme (e independiente de píxel a píxel) es equivalente a agregar un pequeño valor aleatorio a todos los coeficientes de frecuencia. El resultado es que todos los coeficientes que eran 0 en la imagen original ahora tienen un valor pequeño; mientras que los coeficientes que eran altos en la imagen original están relativamente intactos. Umbralizar los coeficientes de pequeña magnitud cancelará la contribución al ruido en esos coeficientes, aunque no recuperará el efecto del ruido en los coeficientes altos.

Si reemplaza bordes por transitorios / ataques, lo mismo se aplica a los sonidos por cierto.


1

Eche un vistazo al siguiente problema de optimización:

argminx12Axy+λx0

Donde cuenta el número de elementos distintos de cero.0

Se sabe que el umbral duro iterativo se puede utilizar para resolver esto y, en algunos casos, se garantiza que encontrará la solución correcta (consulte Umbral duro iterativo para detección comprimida ).

Ahora, si usa como el Diccionario DCT (que puede y muchos hacen), entonces básicamente lo que hace es tratar de resolver esto.A

Este es el punto de vista de optimización.
La razón por la que funciona tan bien, la idea de representaciones dispersas (bajo grado de libertad).
Bueno, la intuición simple es la eficiencia.
Las cosas deberían ser simples cuando uno usa las herramientas adecuadas para describirlas.

Un gran lugar para analizar en profundidad es eDx: representaciones dispersas en el procesamiento de señales e imágenes: Fundamentos de Michael Elad .


0

Los DCT son muy útiles en la compactación de energía, por lo tanto, simplemente después de que un DCT de una imagen se resuelva en algunas de las funciones básicas ponderadas. Después de un DCT, la matriz resultante contendrá multiplicadores para cada función base. Y se puede decir sin pérdida de generalidad que los coeficientes de alto valor son los que contribuyen significativamente a la percepción psico-visual de la imagen por parte del ojo humano.

El ruido de baja frecuencia se sumará a los coeficientes de baja frecuencia, sin embargo, el ruido de alta frecuencia dará como resultado magnitudes más pequeñas de los coeficientes de alta frecuencia de la matriz transformada resultante.

Entonces, cuando la magnitud umbral de la matriz transformada, eliminamos todo el ruido que no es parte de los coeficientes de alta magnitud. Por lo tanto, seguirá habiendo algo de ruido que puede ser evidente después del IDCT.

Pero la idea principal aquí es en imágenes en las que los datos de alta frecuencia son mínimos, un DCT, seguido de un umbral de magnitud probablemente sea mejor que un filtro de paso alto típico. Si uno puede imaginar una imagen en la que cualquier frecuencia de la imagen tiene un componente de imagen real y un componente de ruido, donde el componente de imagen real es pequeño o cero, un DCT seguido de un umbral de magnitud eliminará ese componente de frecuencia, por lo tanto principalmente dirigido al componente ruidoso .

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.