Visión general
La respuesta corta es que tienen el número máximo de vanishing moments
un determinado support
(es decir, número de coeficientes de filtro). Esa es la propiedad "extremal" que distingue a las wavelets Daubechies en general. Hablando en términos generales, más momentos de fuga implica una mejor compresión, y un soporte más pequeño implica menos cómputo. De hecho, la compensación entre los momentos de fuga y el tamaño del filtro es tan importante que domina la forma en que se nombran las wavelets. Por ejemplo, a menudo verá la D4
wavelet referida como D4
o db2
. El se 4
refiere al número de coeficientes, y el2
se refiere al número de momentos de fuga. Ambos se refieren al mismo objeto matemático. A continuación, explicaré más sobre qué momentos son (y por qué queremos hacerlos desaparecer), pero por ahora, solo comprenda que se relaciona con qué tan bien podemos "plegar" la mayor parte de la información en la señal en un formato más pequeño. Número de valores. La compresión con pérdida se logra manteniendo esos valores y desechando los demás.
Ahora, puede haber notado que CDF 9/7
, que se usa JPEG 2000
, tiene dos números en el nombre, en lugar de uno. De hecho, también se conoce como bior 4.4
. Eso es porque no es una wavelet discreta "estándar" en absoluto. De hecho, ni siquiera técnicamente conserva la energía en la señal, ¡y esa propiedad es la razón por la cual las personas se entusiasmaron tanto con el DWT en primer lugar! Los números 9/7
y 4.4
todavía se refieren a los soportes y los momentos de fuga, respectivamente, pero ahora hay dos conjuntos de coeficientes que definen la wavelet. El término técnico es que, en lugar de ser orthogonal
, lo son biorthogonal
. En lugar de profundizar demasiado en lo que eso significa matemáticamente, yo '
JPEG 2000
Una discusión mucho más detallada de las decisiones de diseño que rodean la wavelet CDF 9/7 se puede encontrar en el siguiente documento:
Usevitch, Bryan E. Un tutorial sobre la compresión de imagen moderna con pérdida de ondas: Fundamentos de JPEG 2000 .
Solo revisaré los puntos principales aquí.
Muy a menudo, las wavelets ortogonales de Daubechies en realidad pueden aumentar el número de valores necesarios para representar la señal. El efecto se llama coefficient expansion
. Si estamos haciendo una compresión con pérdida que puede o no importar (ya que de todos modos estamos desechando valores al final), pero definitivamente parece contraproducente en el contexto de la compresión. Una forma de resolver el problema es tratar la señal de entrada como periódica.
[ 0 , 1 , 2 , 3 ] → [ . . 0,0 , 1 , 2 , 3 , 0 , 1 , 2 , 3 , . . . ][ 0 , 1 , 2 , 3 ] → [ . . . , 0 , 1 , 2 , 3 , 3 , 2 , 1 , 0 , 0 , 1 ... ]
Desafortunadamente, la única wavelet ortogonal que tiene las características requeridas es la wavelet Haar (o D2, db1), que solo como un momento de fuga. Ugh Eso nos lleva a wavelets biortogonales, que en realidad son representaciones redundantes y, por lo tanto, no conservan la energía. La razón por la cual las wavelets CDF 9/7 se usan en la práctica es porque fueron diseñadas para acercarse mucho a la conservación de energía. También han probado bien en la práctica.
Hay otras formas de resolver los diversos problemas (mencionados brevemente en el documento), pero estos son los grandes rasgos de los factores involucrados.
Momentos de fuga
Entonces, ¿qué son los momentos y por qué nos importan? Las señales suaves pueden aproximarse bien por polinomios, es decir, funciones de la forma:
a + b x + c x2+ dX3+ . . .
Los momentos de una función (es decir, señal) son una medida de cuán similar es a una potencia dada de x. Matemáticamente, esto se expresa como un producto interno entre la función y el poder de x. Un momento de desaparición significa que el producto interno es cero y, por lo tanto, la función no se "parece" a esa potencia de x, como sigue (para el caso continuo):
∫XnorteF( x ) dx = 0
ϕψ. Esa terminología parece variar un poco, pero es lo que usaré aquí. En cada etapa del DWT, el filtro de paso alto se usa para "despegar" una capa de detalles, y el filtro de paso bajo produce una versión suavizada de la señal sin ese detalle. Si el filtro de paso alto tiene momentos de fuga, esos momentos (es decir, características polinómicas de bajo orden) se rellenarán en la señal suavizada complementaria, en lugar de la señal de detalle. En el caso de compresión con pérdida, es de esperar que la señal de detalle no tenga mucha información y, por lo tanto, podemos tirar la mayor parte.
1 / 2-√
ϕ = [ 1 , 1 ]ψ = [ 1 , - 1 ]
X0 0= 1[ 2 , 2 , 2 , 2 ]
[ 2 , 2 , 2 , 2 ] →ϕψ{ [ 2 + 2 , 2 + 2 ] = [ 4 , 4 ][ 2 - 2 , 2 - 2 ] = [ 0 , 0 ]
Y lo que sucede en la segunda pasada, que opera solo con la señal suavizada:
[ 4 , 4 ] →ϕψ{ [ 4 + 4 ] = [ 8 ][ 4 - 4 ] = [ 0 ]
288
Otras lecturas
Estoy pasando por alto MUCHOS detalles para mantener accesible el tratamiento anterior. El siguiente artículo tiene un análisis mucho más profundo:
M. Unser y T. Blu, Propiedades matemáticas de los filtros wavelet JPEG2000 , IEEE Trans. Image Proc., Vol. 12, no. 9, septiembre de 2003, pág.1080-1090.
Nota
El documento anterior parece sugerir que la wavelet JPEG2000 se llama Daubechies 9/7, y es diferente de la wavelet CDF 9/7.
D a u b e c h i e s8
[11] A. Cohen, I. Daubechies y JC Feauveau, "Bases biorthogonales de wavelets de soporte compacto", Comm. Aplicación pura Math., Vol. 45, no. 5, págs. 485–560, 1992.
El borrador del estándar JPEG2000 ( enlace pdf ) que he examinado también llama al filtro oficial Daubechies 9/7. Hace referencia a este artículo:
M. Antonini, M. Barlaud, P. Mathieu e I. Daubechies, "Codificación de imagen usando la transformada wavelet", IEEE Trans. Proc. De imagen 1, págs. 205-220, abril de 1992.
No he leído ninguna de esas fuentes, así que no puedo decir con certeza por qué Wikipedia llama al wavelet JPEG2000 CDF 9/7. Parece que puede haber una diferencia entre los dos, pero la gente llama al wavelet oficial JPEG2000 CDF 9/7 de todos modos (¿porque se basa en la misma base?). Independientemente del nombre, el documento de Usevitch describe el que se usa en el estándar.