Sí, puede arruinarte bastante si no consigues los fundamentos desde el principio. Así es como interpreto la correlación, y me ha funcionado para lo que hago para vivir.
Comencemos con un ejemplo relativamente simple. Eche un vistazo a la siguiente figura (extraída de dspguide ... este es realmente un gran libro en línea para conocer los conceptos básicos de DSP).
Tenemos una antena que transmite una breve ráfaga de energía de ondas de radio en alguna dirección. Si la onda que se propaga golpea un objeto ... como un helicóptero en esta figura, una pequeña fracción de la energía se refleja hacia un receptor de radio. Este receptor está cerca de la antena transmisora.
Este breve estallido de energía de radio, por el bien de este ejemplo, es una pequeña forma triangular. Cuando la señal se refleja en el helicóptero y luego se repite en el receptor, esta señal constará de dos partes:
- Una versión desplazada y escalada del pulso transmitido, y
- Ruido aleatorio, resultante de ondas de radio interferentes, ruido térmico en la electrónica y otros factores.
Hablando en términos generales, podemos determinar qué tan lejos está el objeto usando este concepto. Dado que las señales de radio viajan aproximadamente a la velocidad de la luz, el cambio entre el pulso transmitido y recibido es una medida aproximada de la distancia al objeto que se detecta.
Como tal, este es nuestro problema general:
Dada una señal de alguna forma conocida, ¿cuál es la mejor manera de determinar dónde (o si) se produce la señal en otra señal?
La mejor manera de responder esto es la correlación .
Hay dos paradigmas diferentes para la correlación informática. El primero se llama autocorrelación , donde se compara una señal con desplazamientos de tiempo desplazados de sí misma. Este paradigma que estamos describiendo (también visto en la figura) se define como correlación cruzada , donde estamos comparando con otro señal , especialmente la señal recibida. Básicamente, estamos comparando la señal recibida con versiones desplazadas de la señal transmitida original. Básicamente, echamos un vistazo a lo que hemos recibido y lo que se transmitió. Tomamos lo que recibimos y cambiamos el tiempo de la señal transmitida original por diferentes valores de tiempo. Luego hacemos una comparación con cada una de estas señales y el resultado recibido. Lo que nos de mayor el valor indicará qué tan lejos está el helicóptero.
La amplitud de cada muestra en la señal de correlación cruzada es una medida de cuánto se asemeja la señal recibida a la señal objetivo, en esa ubicación. Esto significa que se producirá un pico en la señal de correlación cruzada para cada señal objetivo que esté presente en la señal recibida. En otras palabras, el valor de la correlación cruzada se maximiza cuando la señal objetivo está alineada con las mismas características en la señal recibida.
Si hay ruido en la señal recibida, también habrá ruido en la señal de correlación cruzada. Es un hecho inevitable que el ruido aleatorio se parece en cierta medida a cualquier señal objetivo que pueda elegir. El ruido en la señal de correlación cruzada simplemente mide esta similitud. Excepto por este ruido, el pico generado en la señal de correlación cruzada es simétrico entre su izquierda y su derecha. Esto es cierto incluso si la señal objetivo no es simétrica.
Una buena cosa para recordar es que la correlación cruzada está tratando de detectar la señal objetivo, no recrearla. No hay razón para esperar que el pico se vea como la señal objetivo. La correlación es la técnica óptima para detectar una forma de onda conocida en ruido aleatorio. Para ser perfectamente correcto, solo es óptimo para el ruido blanco aleatorio. El uso de la correlación para detectar una forma de onda conocida se denomina frecuentemente filtrado combinado .
tl;dr
- La correlación es una medida de cuánto se parece una señal a otra. La señal puede ser imágenes, características, bordes, etc. Es simplemente una medida de semejanza entre una señal y otra.