¿Cuál es el significado físico de la convolución de dos señales?


50

Si involucramos 2 señales, obtenemos una tercera señal. ¿Qué representa esta tercera señal en relación con las señales de entrada?



1
Es solo "reversa, cambio, multiplicación y suma", no más.
chaohuang

Tiene el significado de "promediar", en términos de procesamiento de señales que podrían significar eliminar componentes de alta frecuencia.
Giwrgos Rizeakos

3
He estado buscando un recurso que explica el significado físico de la convolución por un tiempo y finalmente lo encontré aquí: colah.github.io/posts/2014-07-Understanding-Convolutions
faridghar

considere cualquier sistema físico o mecánico, entonces la entrada al sistema es x (n), los parámetros que ya definimos son h (n). la función de trabajo para que el sistema funcione es y (N) = x (N) * h (N) ej: considere la onda sinusoidal como entrada a un multiplicador, generalmente el multiplicador funciona con tantos circuitos analógicos correctos, podemos cambiar el rendimiento del dispositivo simplemente variando parámetros entonces los parámetros que pasamos son h (n)
user6151179

Respuestas:


40

No hay particularmente ningún significado "físico" en la operación de convolución. El uso principal de la convolución en ingeniería es describir la salida de un sistema lineal, invariante en el tiempo (LTI) . El comportamiento de entrada-salida de un sistema LTI se puede caracterizar a través de su respuesta de impulso , y la salida de un sistema LTI para cualquier señal de entrada se puede expresar como la convolución de la señal de entrada con la respuesta de impulso del sistema.x(t)

Es decir, si la señal se aplica a un sistema LTI con respuesta de impulso , entonces la señal de salida es:h ( t )x(t)h(t)

y(t)=x(t)h(t)=x(τ)h(tτ)dτ

Como dije, no hay mucha interpretación física, pero puedes pensar en una convolución cualitativamente como "manchando" la energía presente en en el tiempo de alguna manera, dependiendo de la forma de la respuesta al impulso . A nivel de ingeniería (los matemáticos rigurosos no lo aprobarían), puede obtener una idea al observar más de cerca la estructura del integrando en sí. Puede pensar en la salida como la suma de un número infinito de copias de la respuesta al impulso, cada una desplazada por un retardo de tiempo ligeramente diferente ( ) y escalada de acuerdo con el valor de la señal de entrada al valor de que corresponde al retraso: .h ( t ) y ( t ) τ t x ( τ )x(t)h(t)y(t)τtx(τ)

Este tipo de interpretación es similar a llevar la convolución de tiempo discreto (discutido en la respuesta de Atul Ingle) a un límite de un período de muestra infinitamente corto, que nuevamente no es completamente matemáticamente sólido, pero constituye una forma decentemente intuitiva de visualizar la acción. para un sistema de tiempo continuo.


2
El integrando debe serx(τ)h(tτ).
Atul Ingle

1
Pero esto no es solo cambiar la señal y luego tomar la suma de salida, una de las señales se invierte primero a diferencia de la correlación. Y si una de las señales es la respuesta al impulso, entonces está bien, pero qué pasa si dos señales son diferentes como convolucionar 2 imágenes
pj

@ParagJain: En realidad, solo está tomando la suma de muchas (en realidad un número infinito) de copias escaladas de la respuesta al impulso. El término de respuesta al impulso no se invierte con respecto a la variable de tiempo . Para la correlación cruzada, como notó, el signo en dentro del argumento de respuesta al impulso se cambia a a . No importa si es realmente la respuesta de un sistema LTI o no; podría ser una imagen como usted propuso o cualquier señal para el caso. La acción difusa creada por la convolución es la misma, como se describe en las respuestas aquí. t τ + h ( t )h(tτ)tτ+h(t)
Jason R

20

Una explicación intuitiva particularmente útil que funciona bien para señales discretas es pensar en la convolución como una "suma ponderada de ecos" o "suma ponderada de recuerdos".

Por un momento, suponga que la señal de entrada a un sistema LTI discreto con función de transferencia es un impulso . La convolución es Esto es solo un eco (o memoria) de la función de transferencia con retraso de k unidades.δ ( n - k ) y ( n )h(n)δ(nk)

y(n)=m=δ(mk)h(nm)=h(nk).

Ahora piense en una señal de entrada arbitraria como una suma de funciones ponderadas . Entonces la salida es una suma ponderada de versiones retrasadas de h (n).δx(n)δ

Por ejemplo, si , entonces escriba .x(n)={1,2,3}x(n)=δ(n)+2δ(n1)+3δ(n2)

La salida del sistema es una suma de los ecos , y con los pesos apropiados 1, 2 y 3, respectivamente.h(n)h(n1)h(n2)

Entonces .y(n)=h(n)+2h(n1)+3h(n2)


1
Podría ser muy útil agregar una representación gráfica de cada una de sus ecuaciones. Algunas personas (como yo) tienen una mejor comprensión de la convolución al mirarla visualmente.
PhilMacKay

1
@PhilMacKay Para obtener una representación gráfica (en realidad, una representación tabular) de convolución discreta, consulte esta respuesta .
Dilip Sarwate

1
Los "ecos" realmente deberían ser reemplazados por "recuerdos". Recuerdo de cosas pasadas: Proust.
rrogers

Para una representación gráfica que muestra la convolución de dos señales de vagones de caja, vea blog.mbedded.ninja/programming/signal-processing/convolution
gbmhunter

11

Una buena forma intuitiva de entender la convolución es mirar el resultado de la convolución con una fuente puntual.

Como ejemplo, la convolución 2D de un punto con la óptica defectuosa del telescopio espacial Hubble crea esta imagen:

ingrese la descripción de la imagen aquí

Ahora imagine lo que sucede si hay dos (o más) estrellas en una imagen: obtiene este patrón dos veces (o más), centrado en cada estrella. La luminosidad del patrón está relacionada con la luminosidad de una estrella. (Tenga en cuenta que una estrella es prácticamente siempre una fuente puntual).

Estos patrones son básicamente la multiplicación de la fuente puntual con el patrón contorneado, con el resultado almacenado en el píxel de modo que reproduzca el patrón cuando la imagen resultante se vea en su totalidad.

Mi forma personal de visualizar un algoritmo de convolución es la de un bucle en cada píxel de la imagen de origen. En cada píxel, multiplica por el valor del patrón contorneado, y almacena el resultado en el píxel cuya posición relativa corresponde al patrón. Hazlo en cada píxel (y suma los resultados en cada píxel), y obtendrás el resultado.


6

Piensa en esto ... Imagina un tambor que lo estás tocando repetidamente para escuchar la música, ¿verdad? Su baqueta aterrizará en la membrana por primera vez debido al impacto que vibrará, cuando la golpee por segunda vez, la vibración debido al primer impacto ya se ha deteriorado en cierta medida. Entonces, cualquier sonido que escuche es el latido actual y la suma de la respuesta decaída de los impactos anteriores. Entonces, si es la fuerza de impacto en el momento , entonces el impacto será Fuerza Tiempo de impactok xx(k)kx

Cual es

x(k)dk

Donde es infinitesimalmente pequeño tiempo de impactodk

y está escuchando el sonido @ , entonces el tiempo transcurrido será , suponga que si la membrana del tambor tiene un efecto de desintegración, definido por una función , donde es el tiempo transcurrido, en nuestro caso , entonces La respuesta de impacto @ será . Entonces, el efecto de en el tiempo t será la multiplicación de ambos, es decir, .t - k h ( u ) u t - k k h ( t - k ) x ( k ) d k x ( k ) h ( t - k ) d kttkh(u)utkkh(tk)x(k)dkx(k)h(tk)dk

Entonces, el efecto general de la música que escucharemos será el efecto integrado de todos los impactos. Eso también desde infinito negativo hasta más infinito. Que es lo que se conoce como convolución.


ilustración interesante :)
tomab

4

También puede pensar en la convolución como difuminado / suavizado de una señal por otra. Si tiene una señal con pulsos y otra de, por ejemplo, un pulso cuadrado único, el resultado será pulsos borrosos o suavizados.

Otro ejemplo es que dos pulsos cuadrados convolucionados salen como un trapecio aplanado.


4

Si toma una foto con una cámara con la lente desenfocada, el resultado es una convolución de la imagen enfocada con la función de dispersión de puntos del desenfoque.

La distribución de probabilidad de la suma de un par de dados es la convolución de las distribuciones de probabilidad de los dados individuales.

La multiplicación larga es convolución, si no llevas de un dígito al siguiente. Y si cambias uno de los números. {2, 3, 7} convolucionado con {9, 4} es {8, 30, 55, 63}

      2   3   7
   X      4   9
---------------
     18  27  63 
  8  12  28
---------------
  8  30  55  63

(Puede terminar la multiplicación llevando el "6" del 63 al 55, y así sucesivamente).


3

En señales y sistemas, la convolución generalmente se usa con la señal de entrada y la respuesta al impulso para obtener una señal de salida (tercera señal). Es más fácil ver la convolución como "suma ponderada de entradas pasadas" porque las señales pasadas también influyen en la salida de corriente.

No estoy seguro de si esta es la respuesta que estaba buscando, pero recientemente hice un video porque me molestó durante mucho tiempo. https://www.youtube.com/watch?v=1Y8wHa3fCKs&t=14s Aquí hay un breve video. Por favor disculpe mi inglés jajaja.


2

Otra forma de ver la convolución es considerar que tienes dos cosas:

  • DATOS - cantidades ciertamente corrompidas por algún ruido - y en posiciones aleatorias (en tiempo, espacio, asígnelo)
  • PATRÓN = algún conocimiento de cómo debería verse la información

la convolución de DATA con (el simétrico espejo del) PATTERN es otra cantidad que evalúa, conociendo el PATTERN, qué tan probable es que esté en cada una de las posiciones dentro de los DATA.

Técnicamente, en cada posición, esta cantidad es la correlación (este es el espejo del PATRÓN) y, por lo tanto, mide la probabilidad logarítmica bajo algunos supuestos generales (ruido gaussiano independiente). La convolución permite calcularlo en cada posición (en espacio, tiempo ...) en paralelo.


2

Una convolución es una integral que expresa la cantidad de superposición de una función (digamos ) a medida que se desplaza sobre otra función (digamos ) donde .f g fgfgf


2

¡El significado físico es que una señal pasa a través de un sistema LTI! La convolución se define como flip (una de las señales), shift, multiplica y sum. Voy a explicar mi intuición sobre cada uno.

1. ¿Por qué volteamos una de las señales en convolución? ¿Qué significa?

Porque el último punto en la representación de la señal de entrada es el primero que ingresa al sistema (observe el eje de tiempo). La convolución se define para sistemas invariantes de temporizador lineal. Todo está relacionado con el tiempo y cómo lo representamos en matemáticas. Hay dos señales en convolución, una representa la señal de entrada y otra representa la respuesta del sistema. Entonces, la primera pregunta aquí es ¿Cuál es la señal de respuesta del sistema? La respuesta del sistema es la salida del sistema en un tiempo dado ta una entrada con solo un elemento distinto de cero en un tiempo dado t(señal de impulso que se desplaza por t).

2. ¿Por qué las señales se multiplican punto por punto?

Nuevamente, veamos la definición de señal de respuesta del sistema. Como se dijo, es la señal que se forma al cambiar una función de impulso ty al trazar la salida para cada uno de estos t's. También podemos imaginar la señal de entrada como suma de funciones de impulso con diferentes amplitudes (escalas) y fases. OK, entonces la respuesta del sistema a la señal de entrada en un momento dado es la respuesta de la señal multiplicada por (o escalada por) la amplitud de la entrada en ese tiempo dado.

3. ¿Qué significa cambiar?

Dicho esto (1 y 2), el desplazamiento se realiza para obtener la salida del sistema para cualquier punto de señal de entrada a la vez t.

Espero que les ayude amigos!


2

[Como la pregunta sigue apareciendo, una breve edición] La salida es el filtrado conjunto de las dos señales o funciones de entrada . En otras palabras, cómo es suavizado por considerado como un filtro, y simétricamente cómo es suavizado por considerado como una función de suavizado. Hasta cierto punto, esta convolución es una especie de "Mínimo común múltiplo" entre dos señales (en lugar de números).x 2 x 2 x 1x1x2x2x1

Sigue una "visión del sistema" más larga: piense en una visión ideal ( platónica ) de un punto. La cabeza de un alfiler, muy delgada, en algún lugar del espacio vacío. Puede abstraerlo como un Dirac (discreto o continuo).

Un punto en el espacio

Míralo desde lejos, o como una persona miope (como yo), se vuelve borroso. Ahora imagina que el punto también te está mirando a ti. Desde el punto de vista, también puede ser una singularidad. El punto también puede ser miope, y el medio entre ustedes dos (usted como singularidad y el punto) puede no ser transparente.

Entonces, la convolución es como un puente sobre aguas turbulentas . Nunca pensé que podría citar a Simon y Garfunkel aquí. Dos fenómenos tratando de apoderarse el uno del otro. El resultado es el desenfoque de uno borroso por el otro, simétricamente. Los desenfoques no tienen que ser lo mismo. Su visión borrosa miope se combina de manera uniforme con la borrosidad del objeto. La simetría es tal que si la falta de claridad del objeto se convierte en su discapacidad visual y viceversa, el desenfoque general sigue siendo el mismo. Si uno de ellos es ideal, el otro está intacto. Si puede ver perfectamente, verá el desenfoque exacto del objeto. Si el objeto es un punto perfecto, se obtiene la medida exacta de su miopía.

Todo eso bajo algunos supuestos de linealidad. La convolución es una operación complicada . En el dominio de Fourier, puede interpretarlo como un producto de desenfoques . O en el dominio -Fourier, puede interpretarse como una suma de desenfoques .log

Puedes consultar ¿Pero por qué? Matemáticas intuitivas: convolución

difuminar


1

La forma en que escucha el sonido en un entorno determinado (habitación, espacio abierto, etc.) es una convolución de la señal de audio con la respuesta de impulso de ese entorno.

En este caso, la respuesta al impulso representa las características del entorno, como las reflexiones de audio, el retraso y la velocidad del audio, que varía con la temperatura.


1

Para reformular las respuestas:

Para el procesamiento de señales es la suma ponderada del pasado en el presente. Típicamente, un término es el historial de voltaje en una entrada a un filtro y el otro término es un filtro o algo así que tiene "memoria". Por supuesto, en el procesamiento de video, todos los píxeles adyacentes toman el lugar de "pasado".

Por probabilidad, es una probabilidad cruzada para un evento dados otros eventos; la cantidad de maneras de obtener un 7 en dados es la posibilidad de obtener un: 6 y 1, 3 y 4, 2 y 5. es decir, la suma de probabilidades P (2) multiplicado por la probabilidad P (7-2): P ( 7-2) P (2) + P (7-1) * P (1) + .....


1

La convolución es una forma matemática de combinar dos señales para formar una tercera señal. Es una de las técnicas más importantes en DSP ... ¿por qué? Porque usando esta operación matemática puede extraer la respuesta de impulso del sistema. Si no sabe por qué la respuesta de impulso del sistema es importante, lea sobre esto en http://www.dspguide.com/ch6.htm . Utilizando la estrategia de descomposición de impulsos, los sistemas se describen mediante una señal llamada respuesta de impulso. La convolución es importante porque relaciona las tres señales de interés: la señal de entrada, la señal de salida y la respuesta al impulso . Es una operación matemática formal, al igual que la multiplicación, la suma y la integración. La suma toma dos números y produce un tercer número, mientras que la convolución toma dos señales y produce una tercera señal . En los sistemas lineales, la convolución se usa para describir la relación entre tres señales de interés: la señal de entrada, la respuesta al impulso y la señal de salida (de Steven W. Smith). Una vez más, esto está muy ligado al concepto de respuesta al impulso que debe leer al respecto.


-2

El impulso provoca una secuencia de salida que captura la dinámica del sistema (futuro). Al voltear esta respuesta de impulso, la usamos para calcular la salida de La combinación ponderada de todos los valores de entrada anteriores. Esta es una dualidad asombrosa.


-3

En términos simples, significa transferir entradas de un dominio a otro dominio en el que nos resulta más fácil trabajar. La convulación está vinculada con la transformación de Laplace, y a veces es más fácil trabajar en el dominio s, donde podemos hacer adiciones básicas a las frecuencias. y también como laplace transform es una función uno a uno, es muy probable que no corrompamos la entrada. Antes de tratar de entender qué significa el teorema general de la convulsión en significado físico, deberíamos comenzar en el dominio de la frecuencia. la suma y la multiplicación escalar siguen la misma regla que la transformación de Laplace es un operador lineal. c1.Lap (f (x) + c2.Lap g (x) = Lap (c1.f (x) + c2.g (x)). Pero lo que es Lap f (x) .Lap g (x) es lo que define el teorema de la convulación.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.