La idea de convolución
Mi exposición favorita del tema está en una de las conferencias de Brad Osgood sobre la Transformada de Fourier . La discusión sobre la convolución comienza alrededor de las 36:00, pero toda la conferencia tiene un contexto adicional que vale la pena ver.
La idea básica es que, cuando define algo como la Transformada de Fourier, en lugar de trabajar directamente con la definición todo el tiempo, es útil derivar propiedades de nivel superior que simplifiquen los cálculos. Por ejemplo, una de esas propiedades es que la transformación de la suma de dos funciones es igual a la suma de las transformaciones, es decir
F{ f+ g} = F{ f} + F{ g} .
Eso significa que si tiene una función con una transformación desconocida, y puede descomponerse como una suma de funciones con transformaciones conocidas, básicamente obtendrá la respuesta de forma gratuita.
Ahora, dado que tenemos una identidad para la suma de dos transformadas, es una pregunta natural preguntar cuál es la identidad para el producto de dos transformadas, es decir
F{ f} F{ g} = ? .
Resulta que cuando calcula la respuesta, la convolución es lo que aparece. Toda la derivación se da en el video, y dado que su pregunta es principalmente conceptual, no la resumiré aquí.
La implicación de acercarse a la convolución de esta manera es que es una parte intrínseca de la forma en que la Transformada de Laplace (de la cual la Transformada de Fourier es un caso especial) convierte ecuaciones diferenciales ordinarias de coeficiente constante lineal (LCCODE) en ecuaciones algebraicas. El hecho de que dicha transformación esté disponible para hacer que LCCODE sea analíticamente manejable es una gran parte de la razón por la que se estudian en el procesamiento de señales. Por ejemplo, para citar a Oppenheim y Schafer :
Debido a que son relativamente fáciles de caracterizar matemáticamente y porque pueden diseñarse para realizar funciones útiles de procesamiento de señales, la clase de sistemas lineales invariantes de desplazamiento se estudiará ampliamente.
Entonces, una respuesta a la pregunta es que si está utilizando métodos de transformación para analizar y / o sintetizar sistemas LTI, tarde o temprano, surgirá una convolución (ya sea implícita o explícitamente). Tenga en cuenta que este enfoque para introducir convolución es muy estándar en el contexto de ecuaciones diferenciales. Por ejemplo, vea esta conferencia MIT de Arthur Mattuck . La mayoría de las presentaciones presentan la integral de convolución sin comentarios, luego derivan sus propiedades (es decir, la sacan de un sombrero), o hablan sobre la extraña forma de la integral, hablan de voltearse y arrastrarse, inversión de tiempo, etc., etc. .
La razón por la que me gusta el enfoque del profesor Osgood es que evita todo ese tsouris, además de proporcionar, en mi opinión, una visión profunda de cómo los matemáticos probablemente llegaron a la idea en primer lugar. Y cito:
Dije: "¿Hay alguna forma de combinar F y G en el dominio del tiempo, de modo que en el dominio de la frecuencia se multipliquen los espectros y se multipliquen las transformadas de Fourier?" Y la respuesta es sí, por esta integral complicada. No es tan obvio. No saldrías de la cama por la mañana y escribirías esto, y esperarías que esto resolvería ese problema. ¿Cómo lo conseguimos? Usted dijo, suponga que el problema está resuelto, vea qué tiene que suceder, y luego tendríamos que reconocer cuándo es el momento de declarar la victoria. Y es hora de declarar la victoria.
Ahora, siendo un matemático desagradable, cubres tus huellas y dices: "Bueno, simplemente voy a definir la convolución de dos funciones con esta fórmula".
Sistemas LTI
En la mayoría de los textos DSP, la convolución generalmente se introduce de una manera diferente (que evita cualquier referencia a los métodos de transformación). Al expresar una señal de entrada arbitraria como una suma de impulsos unitarios escalados y desplazados,x ( n )
x ( n ) = ∑k=−∞∞x(k)δ(n−k),(1)
dónde
δ( n ) = { 0 ,1 ,n ≠ 0n = 0 ,(2)
Las propiedades definitorias de los sistemas lineales invariantes en el tiempo conducen directamente a una suma de convolución que involucra la respuesta al impulso . Si el sistema definido por un operador LTI L se expresa como y ( n ) = L [ x ( n ) ] , entonces aplicando las propiedades respectivas, es decir, linealidadh ( n ) = L [ δ ( n ) ] Ly(n)=L[ x(n) ]
L[ ax1(n)+bx2(n) ]Transform of the sum of scaled inputs=aL[ x1(n) ]+bL[ x2(n) ]Sum of scaled transforms,(3)
e invariancia de tiempo / turno
L[ x(n) ]=y(n) −→−−−impliesL[ x(n−k) ]=y(n−k),(4)
el sistema puede reescribirse como
y( n ) = L [ ∑k = - ∞∞x ( k ) δ( n - k ) ]Transformación de la suma de entradas escaladas= ∑k = - ∞∞x ( k ) L [ δ( n - k ) ]Suma de transformaciones escaladas= ∑k = - ∞∞x(k)h(n−k).Convolution with the impulse response
Esa es una forma muy estándar de presentar convolución, y es una forma perfectamente elegante y útil de hacerlo. Se pueden encontrar derivaciones similares en Oppenheim y Schafer , Proakis y Manolakis , Rabiner y Gold , y estoy seguro de que muchos otros. Dilip da una idea más profunda [que va más allá de las presentaciones estándar] en su excelente respuesta aquí .
Tenga en cuenta, sin embargo, que esta derivación es algo así como un truco de magia. Echando otro vistazo a cómo se descompone la señal en , podemos ver que ya está en forma de convolución. Si(1)
(f∗g)(n)f convolved with g=∑k=−∞∞f(k)g(n−k),
entonces es solo x ∗ δ . Debido a que la función delta es el elemento de identidad para la convolución, decir que cualquier señal puede expresarse de esa forma es muy parecido a decir que cualquier número n puede expresarse como n + 0 o n × 1 . Ahora, elegir describir las señales de esa manera es brillante porque conduce directamente a la idea de una respuesta al impulso; es solo que la idea de convolución ya está "incorporada" a la descomposición de la señal.(1)x∗δnn+0n×1
Desde esta perspectiva, la convolución está intrínsecamente relacionada con la idea de una función delta (es decir, es una operación binaria que tiene la función delta como elemento de identidad). Incluso sin considerar su relación con la convolución, la descripción de la señal depende de manera crucial de la idea de la función delta. Entonces, la pregunta es, ¿de dónde surgió la idea de la función delta en primer lugar? Por lo que puedo decir, se remonta al menos al documento de Fourier sobre la teoría analítica del calor, donde aparece implícitamente. Una fuente de información adicional es este documento sobre Origen e Historia de la Convolución de Alejandro Domínguez.
Ahora, esos son los dos enfoques principales de la idea en el contexto de la teoría de sistemas lineales. Uno favorece la comprensión analítica y el otro favorece la solución numérica. Creo que ambos son útiles para tener una idea completa de la importancia de la convolución. Sin embargo, en el caso discreto, descuidando completamente los sistemas lineales, hay un sentido en el que la convolución es una idea mucho más antigua.
Multiplicación polinómica
Gilbert Strang da una buena presentación de la idea de que la convolución discreta es solo una multiplicación polinómica en esta conferencia que comienza alrededor de las 5:46. Desde esa perspectiva, la idea se remonta a la introducción de sistemas de números posicionales (que representan los números implícitamente como polinomios). Debido a que la transformación Z representa señales como polinomios en z, la convolución también surgirá en ese contexto, incluso si la transformación Z se define formalmente como un operador de retardo sin recurrir a análisis complejos y / o como un caso especial de Laplace transformar .