¿Similitud de dos transformadas discretas de Fourier?


14

En el modelado climático, está buscando modelos que puedan representar adecuadamente el clima de la Tierra. Esto incluye mostrar patrones semicíclicos: cosas como la Oscilación del Sur de El Niño. Pero la verificación del modelo ocurre generalmente en períodos de tiempo relativamente cortos, donde hay datos de observación decentes (últimos ~ 150 años). Esto significa que su modelo podría mostrar los patrones correctos, pero estar fuera de fase, de modo que las comparaciones lineales, como la correlación, no detectarán que el modelo está funcionando bien.

Las transformadas discretas de Fourier se usan comúnmente para analizar datos climáticos ( aquí hay un ejemplo ), a fin de detectar estos patrones cíclicos. ¿Existe alguna medida estándar de la similitud de dos DFT que pueda usarse como herramienta de verificación (es decir, una comparación entre el DFT para el modelo y el de las observaciones)?

¿Tendría sentido tomar la integral del mínimo de las dos DFT de área normalizada (utilizando valores reales absolutos)? Creo que esto daría como resultado una puntuación , donde x = 1X[0 0,1]X=1exactamente los mismos patrones, X=0 0Patrones totalmente diferentes. ¿Cuáles podrían ser los inconvenientes de tal método?


3
¿Ha considerado el uso de la coherencia (en el sentido del procesamiento de la señal, no la estadística), una medida espectral cruzada? No estoy seguro de si ese es el tipo de medición que está buscando.
jonsca

@jonsca: cosas interesantes. Ciertamente no estoy buscando causalidad, pero puedo ver cómo podría ser útil. El ejemplo en esa página de Wikipedia es un poco extraño (¿por qué no incluye la presión barométrica como una variable modelo?). Además, no estoy seguro de dónde proviene la cifra del 90% ...
naught101

Buena pregunta. Ese ejemplo se ha agregado al artículo desde la última vez que lo leí. Sospecho que podría tener que ver con la coherencia centrada en las frecuencias por día y por 2 días (por lo tanto, vinculada a un fenómeno diario de mareas), pero eso es solo una suposición ...
jonsca

(No sé si se integraron para encontrar ese 90%, sin embargo)
jonsca

Respuestas:


12

La coherencia espectral, si se usa correctamente, lo haría. La coherencia se calcula en cada frecuencia y, por lo tanto, es un vector. Por lo tanto, una suma de coherencia ponderada sería una buena medida. Por lo general, querrá ponderar las coherencias en frecuencias que tienen una alta energía en la densidad espectral de potencia. De esa manera, estaría midiendo las similitudes en las frecuencias que dominan las series de tiempo en lugar de ponderar la coherencia con un gran peso, cuando el contenido de esa frecuencia en la serie de tiempo es insignificante.

Entonces, en palabras simples, la idea básica es encontrar las frecuencias a las cuales la amplitud (energía) en las señales es alta (interpretar como las frecuencias que constituyen dominantemente cada señal) y luego comparar las similitudes en estas frecuencias con un mayor peso y compare las señales en el resto de las frecuencias con un peso menor.

El área que se ocupa de preguntas de este tipo se llama análisis espectral cruzado. http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf es una excelente introducción al análisis espectral cruzado.

Retardo óptimo: también mira mi respuesta aquí: Cómo correlacionar dos series de tiempo, con posibles diferencias de tiempo

Esto trata de encontrar el retraso óptimo, utilizando la coherencia espectral. R tiene funciones para calcular las densidades espectrales de potencia, las correlaciones automáticas y cruzadas, las transformadas de Fourier y la coherencia. Debe codificar correctamente para encontrar el retraso óptimo para obtener el máximo. coherencia ponderada Dicho esto, también se debe escribir un código para ponderar el vector de coherencia utilizando la densidad espectral. A continuación, puede resumir los elementos ponderados y promediarlo para obtener la similitud observada en el retraso óptimo.


1
Ese es un excelente recurso! Se trata de pruebas de hipótesis muy bien, lo que evita mucho material sobre coherencia
Jonsca

2

¿Has probado otro enfoque para la detección / modelado de señales climáticas, como un análisis de wavelet? El gran problema que puede surgir con el DFT en el análisis climático es en realidad lo que usted menciona: las oscilaciones no son perfectamente periódicas y generalmente tienen diferentes períodos de tiempo, por lo que pueden tener muchos rangos de oscilación diferentes, lo cual es bastante confuso desde la perspectiva de la Transformada de Fourier .

Un análisis wavelet es más adecuado para las señales climáticas porque le permiten verificar diferentes intervalos de tiempo de oscilación; así como un instrumento musical reproduce diferentes frecuencias en diferentes momentos, puede verificar diferentes frecuencias en diferentes períodos de tiempo con la transformación wavelet.

Si está interesado, este artículo de Lau & Weng (1995) debería borrar la mayoría de sus dudas sobre este método. La parte más interesante es que la transformada wavelet de un modelo versus la de los datos son casi directamente comparables, porque puede comparar directamente el período de tiempo que predice su modelo, dejando de lado todos los rangos de oscilación espurios que no lo hace.

PD: Tengo que agregar que quería publicar esto como un comentario, porque en realidad no es lo que piden los OP, pero mi comentario habría sido demasiado grande y decidí publicarlo como una respuesta que podría ser útil como Un enfoque alternativo al de los DFT.


1

He votado a favor y segundo uso del análisis basado en wavelet y espectrograma como alternativa a dft. Si puede descomponer su serie en contenedores de frecuencia de tiempo localizados, reduce los problemas de Fourier de aperiodicidad y no estacionariedad, así como proporciona un buen perfil de datos discretos para comparar.

Una vez que los datos se asignan a un conjunto tridimensional de energía espectral versus tiempo y frecuencia, la distancia euclidiana se puede usar para comparar perfiles. Una coincidencia perfecta se acercaría a la distancia límite inferior de cero. * Puede buscar en áreas de minería de datos de series de tiempo y reconocimiento de voz para enfoques similares.

* tenga en cuenta que el proceso de agrupación wavelet filtrará un poco el contenido de la información: si no puede haber pérdida en los datos comparados, podría ser más adecuado comparar usando la distancia euclidiana en el dominio del tiempo

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.