Resolver un sistema con una actualización diagonal de rango pequeño

Supongamos que tengo el sistema lineal original grande y disperso: . Ahora, no tengo ya que A es demasiado grande para factorizar o cualquier tipo de descomposición de , pero supongo que tengo la solución encontrada con una solución iterativa. $A\textbf{x}_0=\textbf{b}_0$ $A^{-1}$ $A$ $\textbf{x}_0$

Ahora, deseo aplicar una actualización de rango pequeño a la diagonal de A (cambiar algunas de las entradas diagonales): donde es una matriz diagonal con mayormente 0 en su diagonal y algunas valores distintos de cero. Si tuviera podría aprovechar la fórmula de Woodbury para aplicar una actualización a la inversa. Sin embargo, no tengo esto disponible. ¿Hay algo que pueda hacer aparte de resolver todo el sistema nuevamente? ¿Hay alguna forma de que pueda idear un preacondicionador que sea fácil \ más fácil de invertir, de modo que $(A+D)\textbf{x}_1=\textbf{b}_0$ $D$ $A^{-1}$ $M$ , de modo que todo lo que tendría que hacer si tengo es aplicar y un método iterativo convergería en un par / pocas iteraciones. $MA_1 \approx A_0$ $\textbf{x}_0$ $M^{-1}$

linear-algebra iterative-method sparse-matrix

— Costis
fuente

¿Estás comenzando con un buen preacondicionador para

y quieres saber cómo actualizarlo? ¿Qué rango tiene la actualización? (Una actualización de rango

es "pequeña" en comparación con una matriz de tamaño

pero no pequeña en términos de recuento de iteraciones.)

A

$A$

1000

$1000$

10^{9}

$10^9$

— Jed Brown

tiene un tamaño aproximado de

, y la actualización es <1000 (probablemente <100) elementos. Estoy usando un tipo de preacondicionador diagonal para A que funciona muy bien, por lo que actualizarlo sería trivial, pero me preguntaba si hay algo mejor que pueda hacer en lugar de resolver el nuevo sistema desde cero.

A

$A$

10^{6}

$10^6$

10^{7}

$10^7$

— Costis

La solución de un sistema no le dice mucho al respecto. Si resuelve el mismo sistema varias veces, el mapa inverso en esos vectores (y / o espacios de Krylov asociados) le brinda información que puede usarse para acelerar la convergencia. ¿Cuántos sistemas estás resolviendo en cada caso?

— Jed Brown

Actualmente sólo soy la solución para una RHS (

vectorial) con cada

matriz antes de modificar

b

$\textbf{b}$

A

$A$

A

$A$

— Costis

Guardar en las columnas de dos matrices y todos los vectores $B$ $C$ a los que aplicó la matriz en las iteraciones anteriores y los resultados . $b_j$ $c_j=Ab_j$
Para cada nuevo sistema (o , que es el caso especial ), resuelva aproximadamente el sistema lineal sobredeterminado , p. Ej. , seleccionando un subconjunto de las filas (posiblemente todas) y utilizando un método denso mínimo cuadrado. Tenga en cuenta que solo la parte seleccionada de necesita ser ensamblada; ¡Esta es una operación rápida! $(A+D)x'=b'$ $Ax=b'$ $D=0$ $(C+DB)y\approx b'$ $C+DB$
Pon . Esta es una buena aproximación inicial con la cual comenzar la iteración para resolver $x_0=By$ . En caso de que se deban procesar más sistemas, use los productos de vector de matriz en esta nueva iteración para extender las matrices y en el subsistema resultante. $(A+D)x'=b'$ $B$ $C$

Si las matrices y no caben en la memoria principal, almacene en el disco y seleccione el subconjunto de filas por adelantado. Esto le permite mantener en el núcleo la parte relevante de y necesaria para formar el sistema de mínimos cuadrados, y el siguiente puede calcularse mediante una pasada a través de con poco uso de la memoria central. $B$ $C$ $B$ $B$ $C$ $x_0$ $B$

Las filas deben seleccionarse de tal manera que correspondan aproximadamente a una discreta discreción del problema completo. Tomar cinco veces más filas que el número total de multiplicaciones esperadas de vectores de matriz debería ser suficiente.

Editar: ¿Por qué funciona esto? Por construcción, las matrices y están relacionados por . Si el subespacio atravesado por las columnas de contiene el vector de solución exacto (una situación rara pero simple), entonces tiene la forma para algunos . Sustituyendo esto en la ecuación que define obtiene la ecuación $B$ $C$ $C=AB$ $B$ $x'$ $x'$ $x'=By$ $y$ $x'$ $(C+DB)y= b'$ . Por lo tanto, en este caso, el proceso anterior da como punto de partida , que es la solución exacta. $x_0=By=x'$

En general, no se puede esperar encuentre en el espacio de la columna de , pero el punto de partida generado será el punto en este espacio nublado más cercano a , en una métrica determinada por las filas seleccionadas. Por lo tanto, es probable que sea una aproximación sensata. A medida que se procesan más sistemas, el espacio de la columna crece y la aproximación probablemente mejorará mucho, por lo que uno puede esperar converger en cada vez menos iteraciones. $x'$ $B$ $x'$

Edit2: Acerca del subespacio generado: si uno resuelve cada sistema con un método de Krylov, los vectores utilizados para obtener el punto de partida para el segundo sistema abarcan el subespacio de Krylov del primer lado derecho. Por lo tanto, se obtiene una buena aproximación cada vez que este subespacio de Krylov contiene un vector cercano a la solución de su segundo sistema. En general, los vectores utilizados para obtener el punto de partida para el st abarcan un espacio que contiene el subespacio de Krylov de los primeros lados derechos. $(k+1)$ $k$

— Arnold Neumaier
fuente

Gracias, profesor Neumaier. Probaré esto. ¿Podrías darme una breve explicación de cómo funciona esto?

— Costis

Además, ¿qué pasa si quiero resolver el mismo sistema para muchos vectores RHS diferentes? es decir,

, etc. ¿Hay alguna información que pueda usar de las soluciones anteriores para acelerar las siguientes?

A x_{0} = b_{0}

$A\textbf{x}_0=\textbf{b}_0$

A x_{1} = b_{1}

$A\textbf{x}_1=\textbf{b}_1$

A x_{2} = b_{2}

$A\textbf{x}_2=\textbf{b}_2$

— Costis

@Costis: Una resolución con la misma matriz es solo el caso especial

del problema general. Para su primera pregunta, vea la edición.

D = 0

$D=0$

— Arnold Neumaier

@Costis: agregué un poco más de detalle al paso 2. - Si escribe la solicitud, envíe una preimpresión de ma.

— Arnold Neumaier

(C + D B) y \approx b^{'}

$(C + DB)y \approx b'$