Respuestas:
Cuando estudié el método de elementos finitos en la escuela de posgrado, esta noción de multiplicar por una función de peso también me era muy extraña. Eventualmente, encontré una buena analogía (aunque no rigurosa) que me ayudó a entenderla. Esta analogía se basa en la geometría del vector 3D y en la comprensión de las proyecciones y el producto de puntos.
Geometria 3D
Imagine un plano 2D en algún lugar del espacio euclidiano 3D. Este plano puede considerarse como el lapso de dos vectores y . Por lo tanto, cualquier vector en el plano puede escribirse como una combinación lineal de estos vectores; es decir,v 2 w w = c 1 v 1 + c 2 v 2
Ahora imagine un punto en el espacio 3D que no está en el plano. Considere la pregunta: de todos los puntos en el plano, ¿qué punto está más cerca de ? Es el punto (que no se muestra en la imagen de arriba) que se encuentra en la línea que pasa por el punto y es perpendicular al plano. El punto también se conoce como la proyección ortogonal de en el plano. A pesar de que no sabemos las coordenadas de este punto , sabemos que el vector entre y es perpendicular a todos los vectores que definen el plano, es decir yQ w Q w Q w Q w v 1 v 2 Q w → Q - → w → Q - → w . Perpendicular también significa que el producto escalar es cero. Si denotamos el vector entre y como , entonces obligar a a ser perpendicular al plano también implica
y
Esto da como resultado un sistema de ecuaciones que podemos resolver. Observe también que para construir , debemos conocer la coordenada de
Analogía para el Método Galerkin
Supongamos que la solución es una combinación lineal finita de funciones , .., ; por lo tanto, . Esta combinación lineal actúa como el plano en la discusión anterior.
Ahora, supongamos que existe alguna solución exacta , que no conocemos. Esta solución es como el punto en el espacio 3D que no está en el plano.
En el método de Galerkin, estamos buscando la solución en un espacio (plano) que esté más cerca de la solución verdadera (punto no en el plano). En este sentido, la "mejor solución" es la elección de que la diferencia es perpendicular al espacio . Tenga en cuenta que para los espacios de función, el "producto-punto" se define por la integral de su producto, es decir, . Así, perpedicular implica que el producto escalar entre el todas aquellas funciones de base y , ..., debe ser cero, es decir,
Ahora, es posible que se dice a sí mismo, "Toda esta configuración se apoya críticamente en el supuesto de que sabemos que la solución exacta antes de tiempo. Pero la verdad es que por lo general no sabemos a priori. En cuyo caso, ¿cómo posiblemente calculamos en todas estas ecuaciones "¡Estoy tan contento de que lo hayas preguntado!
La verdad es que no podemos y no evaluamos directamente. Pero sí sabemos lo que y se supone para satisfacer; es decir, el PDE.
Suponga que su problema PDE original es
También podríamos reescribir esto como
Entonces, en lugar de considerar la diferencia absoluta entre las soluciones , consideramos la diferencia residual en todas las ecuaciones (perpendiculares). Es decir, considere no lo que y son, sino lo que y satisfacen en su lugar. Al reemplazar la diferencia absoluta con la diferencia residual en las ecuaciones (perpendiculares) anteriores, podemos escribir
De nuevo, todavía no sabemos qué , así que esto puede no parecer muy útil. Pero, de hecho, podemos reemplazar con el término fuente conocido (ya que ). Así, obtenemos las ecuaciones
Por lo tanto, hacer que el residuo sea ortogonal al espacio dado da como resultado un sistema de ecuaciones que uno puede resolver para los coeficientes .
Resumen
La explicación anterior es una "analogía" aproximada. Realmente no he derivado nada ni he dado una prueba razonable de que pueda ser reemplazado por y aún así producir una aproximación cercana. Tampoco he explicado nada sobre cómo obtener una forma débil del PDE o cómo elegir los espacios donde se encuentran .
Pero toda la idea detrás del método de Galerkin como proyección es que para todas las combinaciones lineales posibles de funciones en un espacio dado (dimensión finita) (lapso de , ..., ), estamos buscando la más cercana a un solución (punto) que generalmente se encuentra fuera del espacio dado. Más cercano significa que estamos buscando la proyección ortogonal de la verdadera solución para el espacio dado. Si no sabemos cuál es la solución exacta , entonces no podemos usar la diferencia absoluta como una métrica en nuestra proyección. Por lo tanto, nos vemos obligados a usar la diferencia residual como la métrica de nuestra proyección; En otras palabras:
La proyección de Galerkin no se trata de lo que es ... Es sobre lo que satisface .
Digamos que quieres resolver la ecuación de Laplace, . Idealmente, por supuesto, le gustaría encontrar una función para que el residual sea cero: . Pero es un objeto de dimensión infinita que, en general, no podemos representar en las computadoras, por lo que debemos encontrar aproximaciones dimensionales finitas . Como no es la solución exacta, no podemos esperar que . La pregunta es qué conjunto de ecuaciones queremos que satisfaga en su lugar.
El método de Galerkin elige como una combinación lineal de funciones de forma y luego determina los coeficientes al requerir que el residual satisfaga el conjunto de ecuaciones .
Pero hay otras opciones que son posibles. Por ejemplo, el método Petrov-Galerkin requiere que donde las funciones de prueba son un conjunto de funciones de ponderación separadas de las funciones de prueba .
Tengo un poco más de material sobre este tema en la clase 4 en http://www.math.tamu.edu/~bangerth/videos.html .
Boris Grigoryevich quiere que no pueda crear residuos con las mismas funciones que utilizó para crear la solución.
Si bien esta pregunta es antigua y ha sido respondida por muchas personas inteligentes, solo quiero anotar la intuición que uso para explicar el método de Galerkin a las personas.
El objetivo en nuestra situación es encontrar una solución lo más cercana posible a alguna ecuación residual continua:
Definamos la función base como , defina la solución aproximada como , y define el residual como , la proyección de Galerkin termina siendo:
Esta expresión integral se puede ver como un producto interno escrito como:
Desde la perspectiva de este producto interno, la proyección de Galerkin obliga al error residual a ser ortogonal a la elección de las funciones básicas. Entonces, si bien puede haber un error verdadero asociado con el uso de una representación dimensional más baja de la solución, la Proyección de Galerkin tiene como objetivo minimizar el componente de error asociado con la base elegida.
Recuerde que cuando multiplica la ecuación de forma fuerte por la función de forma, la función de forma es arbitraria . Por lo tanto, al exigir que el residuo sea ortogonal a cualquier función de forma, dicho residuo es de hecho muy cercano a cero.
Esto no es lo mismo que requerir que el residuo sea exactamente cero, sino un requisito algo debilitado que la solución discreta puede satisfacer.