Motivación detrás del método Galerkin

9

Tengo una pregunta sobre el método de Galerkin. No entiendo por qué el método Galerkin pondera el residual por las funciones de forma y lo establece igual a cero. Quiero saber cuál es la razón de esto. ¿Por qué debemos establecer pesos residuales en funciones iguales a cero?

finite-element projection

— mohammad
fuente

22

Cuando estudié el método de elementos finitos en la escuela de posgrado, esta noción de multiplicar por una función de peso también me era muy extraña. Eventualmente, encontré una buena analogía (aunque no rigurosa) que me ayudó a entenderla. Esta analogía se basa en la geometría del vector 3D y en la comprensión de las proyecciones y el producto de puntos.

Geometria 3D

Imagine un plano 2D en algún lugar del espacio euclidiano 3D. Este plano puede considerarse como el lapso de dos vectores y . Por lo tanto, cualquier vector en el plano puede escribirse como una combinación lineal de estos vectores; es decir, $v_1$ $v_2$ $w$ $w=c_1v_1+c_2v_2$

ingrese la descripción de la imagen aquí

Ahora imagine un punto en el espacio 3D que no está en el plano. Considere la pregunta: de todos los puntos en el plano, ¿qué punto está más cerca de ? Es el punto (que no se muestra en la imagen de arriba) que se encuentra en la línea que pasa por el punto y es perpendicular al plano. El punto también se conoce como la proyección ortogonal de en el plano. A pesar de que no sabemos las coordenadas de este punto , sabemos que el vector entre y es perpendicular a todos los vectores que definen el plano, es decir y $Q$ $Q$ $w$ $Q$ $w$ $Q$ $w$ $Q$ $w$ $v_1$ $v_2$ . Perpendicular también significa que el producto escalar es cero. Si denotamos el vector entre y como , entonces obligar a a ser perpendicular al plano también implica $Q$ $w$ $\vec{Q}-\vec{w}$ $\vec{Q}-\vec{w}$

(\vec{Q} - \vec{w}) \cdot v_{1} = 0

$(\vec{Q}-\vec{w})\cdot v_1=0$

y

(\vec{Q} - \vec{w}) \cdot v_{2} = 0

$(\vec{Q}-\vec{w})\cdot v_2=0$

Esto da como resultado un sistema de ecuaciones que podemos resolver. Observe también que para construir , debemos conocer la coordenada de $\vec{Q}-\vec{w}$ $Q$

Analogía para el Método Galerkin

Supongamos que la solución es una combinación lineal finita de funciones , .., ; por lo tanto, . Esta combinación lineal actúa como el plano en la discusión anterior. $u_h$ $N_1$ $N_k$ $u_h=C_1N_1+...+C_kN_k$

Ahora, supongamos que existe alguna solución exacta , que no conocemos. Esta solución es como el punto en el espacio 3D que no está en el plano. $u$ $u$

En el método de Galerkin, estamos buscando la solución en un espacio (plano) que esté más cerca de la solución verdadera (punto no en el plano). En este sentido, la "mejor solución" es la elección de que la diferencia es perpendicular al espacio . Tenga en cuenta que para los espacios de función, el "producto-punto" se define por la integral de su producto, es decir, . Así, perpedicular implica que el producto escalar entre el todas aquellas funciones de base y , ..., debe ser cero, es decir, $u_h$ $u-u_h$ $u_h$ $<u,v>=\int_\Omega u v$ $u-u_h$ $N_1$ $N_k$

\int_{Ω} (u - u_{h}) N_{1} = 0

$\int_\Omega (u-u_h)N_1 = 0$

. . .

$...$

\int_{Ω} (u - u_{h}) N_{k} = 0

$\int_\Omega (u-u_h)N_k = 0$

Ahora, es posible que se dice a sí mismo, "Toda esta configuración se apoya críticamente en el supuesto de que sabemos que la solución exacta antes de tiempo. Pero la verdad es que por lo general no sabemos a priori. En cuyo caso, ¿cómo posiblemente calculamos en todas estas ecuaciones $u$ $u$ $u-u_h$ "¡Estoy tan contento de que lo hayas preguntado!

La verdad es que no podemos y no evaluamos directamente. Pero sí sabemos lo que y se supone para satisfacer; es decir, el PDE. $u-u_h$ $u$ $u_h$

Suponga que su problema PDE original es

- \nabla \cdot (k (x) \nabla u) = f

$-\nabla\cdot\left(k(x)\nabla u\right)=f$

También podríamos reescribir esto como

A u = f

$Au=f$ donde el operador está definido por la expresión

A

$A$

A u = - \nabla \cdot (k (x) \nabla u)

$Au=-\nabla\cdot\left(k(x) \nabla u \right)$

Entonces, en lugar de considerar la diferencia absoluta entre las soluciones , consideramos la diferencia residual en todas las ecuaciones (perpendiculares). Es decir, considere no lo que y son, sino lo que y satisfacen en su lugar. Al reemplazar la diferencia absoluta con la diferencia residual en las ecuaciones (perpendiculares) anteriores, podemos escribir $u-u_h$ $Au - Au_h$ $u$ $u_h$ $u$ $u_h$

\int_{Ω} (A u - A u_{h}) N_{1} = 0

$\int_\Omega (Au-Au_h)N_1 = 0$

. . .

$...$

\int_{Ω} (A u - A u_{h}) N_{k} = 0

$\int_\Omega (Au-Au_h)N_k = 0$

De nuevo, todavía no sabemos qué , así que esto puede no parecer muy útil. Pero, de hecho, podemos reemplazar con el término fuente conocido (ya que ). Así, obtenemos las ecuaciones $u$ $Au$ $f$ $Au=f$

\int_{Ω} (f - A u_{h}) N_{1} = 0

$\int_\Omega (f-Au_h)N_1 = 0$

. . .

$...$

\int_{Ω} (f - A u_{h}) N_{k} = 0

$\int_\Omega (f-Au_h)N_k = 0$

Por lo tanto, hacer que el residuo sea ortogonal al espacio dado da como resultado un sistema de ecuaciones que uno puede resolver para los coeficientes . $C_1,...,C_k$

Resumen

La explicación anterior es una "analogía" aproximada. Realmente no he derivado nada ni he dado una prueba razonable de que pueda ser reemplazado por y aún así producir una aproximación cercana. Tampoco he explicado nada sobre cómo obtener una forma débil del PDE o cómo elegir los espacios donde se encuentran . $u-u_h$ $Au-Au_h$ $N_1...N_k$

Pero toda la idea detrás del método de Galerkin como proyección es que para todas las combinaciones lineales posibles de funciones en un espacio dado (dimensión finita) (lapso de , ..., ), estamos buscando la más cercana a un solución (punto) que generalmente se encuentra fuera del espacio dado. Más cercano significa que estamos buscando la proyección ortogonal de la verdadera solución para el espacio dado. Si no sabemos cuál es la solución exacta , entonces no podemos usar la diferencia absoluta como una métrica en nuestra proyección. Por lo tanto, nos vemos obligados a usar la diferencia residual como la métrica de nuestra proyección; En otras palabras: $N_1$ $N_k$ $u$

La proyección de Galerkin no se trata de lo que es ... Es sobre lo que satisface . $u$ $u$

— Paul
fuente

3

Digamos que quieres resolver la ecuación de Laplace, . Idealmente, por supuesto, le gustaría encontrar una función para que el residual sea cero: . Pero es un objeto de dimensión infinita que, en general, no podemos representar en las computadoras, por lo que debemos encontrar aproximaciones dimensionales finitas . Como no es la solución exacta, no podemos esperar que . La pregunta es qué conjunto de ecuaciones queremos que satisfaga en su lugar. $-\Delta u = f$ $u$ $r(u) = -\Delta u - f = 0$ $u$ $u_h$ $u_h$ $r(u_h)=0$ $u_h$

El método de Galerkin elige como una combinación lineal de funciones de forma y luego determina los coeficientes al requerir que el residual satisfaga el conjunto de ecuaciones . $u_h=\sum_i U_i \varphi_i$ $N$ $\varphi_i$ $U_i$ $N$ $\left<\varphi_i,r(u_h)\right>=0$

Pero hay otras opciones que son posibles. Por ejemplo, el método Petrov-Galerkin requiere que donde las funciones de prueba son un conjunto de funciones de ponderación separadas de las funciones de prueba . $\left<\psi_i,r(u_h)\right>=0$ $\psi_i$ $N$ $\varphi_i$

Tengo un poco más de material sobre este tema en la clase 4 en http://www.math.tamu.edu/~bangerth/videos.html .

— Wolfgang Bangerth
fuente

Sería bueno agregar algo sobre la integridad del espacio vectorial, la proyección en un subespacio de dimensión finita, la convergencia y quizás operadores positivos.

— Tobias

1

@Tobias: Claro, claro, pero la pregunta era sobre la motivación más fundamental. No quería complicarlo más de lo necesario; tal vez una de las otras respuestas (¿la suya?) Puede agregar estos problemas.

— Wolfgang Bangerth

2

Boris Grigoryevich quiere que no pueda crear residuos con las mismas funciones que utilizó para crear la solución.

— John Travolta
fuente

2

Si bien esta pregunta es antigua y ha sido respondida por muchas personas inteligentes, solo quiero anotar la intuición que uso para explicar el método de Galerkin a las personas.

El objetivo en nuestra situación es encontrar una solución lo más cercana posible a alguna ecuación residual continua:

r (u) = 0

$r(u) = 0$ .

Definamos la función base como , defina la solución aproximada como , y define el residual como , la proyección de Galerkin termina siendo: $i^{th}$ $\phi_{i}(x)$ $u_{h} = \sum_{i}^{n} a_{i} \phi_{i}(x)$ $r(u_{h}(x))$

\int_{Ω} r (u_{h} (x)) ϕ_{i} (x) d x = 0 \forall i

$\int_{\Omega} r(u_{h}(x)) \phi_i(x) dx = 0 \;\;\; \forall i$

Esta expresión integral se puede ver como un producto interno escrito como:

⟨ r (u_{h}), ϕ_{i} ⟩ = 0 \forall i

$\left< r(u_{h}), \phi_i\right> = 0 \;\;\; \forall i$

Desde la perspectiva de este producto interno, la proyección de Galerkin obliga al error residual a ser ortogonal a la elección de las funciones básicas. Entonces, si bien puede haber un error verdadero asociado con el uso de una representación dimensional más baja de la solución, la Proyección de Galerkin tiene como objetivo minimizar el componente de error asociado con la base elegida.

— spektr
fuente

0

Recuerde que cuando multiplica la ecuación de forma fuerte por la función de forma, la función de forma es arbitraria . Por lo tanto, al exigir que el residuo sea ortogonal a cualquier función de forma, dicho residuo es de hecho muy cercano a cero.

Esto no es lo mismo que requerir que el residuo sea exactamente cero, sino un requisito algo debilitado que la solución discreta puede satisfacer.

— DanielRch
fuente