¿Se trata de la inversa de una matriz simétrica (covarianza) definida positiva?

27

En estadística y sus diversas aplicaciones, a menudo calculamos la matriz de covarianza , que es positiva definida (en los casos considerados) y simétrica, para varios usos. A veces, necesitamos el inverso de esta matriz para varios cálculos (formas cuadráticas con este inverso como la (única) matriz central, por ejemplo). Dadas las cualidades de esta matriz y los usos previstos, me pregunto:

¿Cuál es la mejor forma, en términos de estabilidad numérica, de computar o usar (digamos para formas cuadráticas o multiplicación de matriz-vector en general) este inverso? ¿Alguna factorización que puede ser útil?

linear-algebra matrix

— Benjamin Allévius
fuente

14

La factorización de Cholesky conduce a una factorización de Cholesky de la inversa con la matriz triangular superior . $C=R^TR$ $C^{-1}=SS^T$ $S=R^{-1}$

En la práctica, es mejor mantener el factor inverso. Si es escaso, generalmente es aún mejor mantener implícito, ya que los productos de matriz de vectores pueden calcularse resolviendo los dos sistemas triangulares y . $R$ $S$ $y=C^{-1}x$ $R^Tz=x$ $Ry=z$

— Arnold Neumaier
fuente

25

Una factorización de Cholesky tiene más sentido para la mejor estabilidad y velocidad cuando se trabaja con una matriz de covarianza, ya que la matriz de covarianza será una matriz simétrica semi-definida positiva. Cholesky es un natural aquí. PERO...

SI tiene la intención de calcular una factorización de Cholesky, antes de calcular la matriz de covarianza, hágase un favor. Haga que el problema sea lo más estable posible calculando una factorización QR de su matriz. (Un QR también es rápido). Es decir, si calcula la matriz de covarianza como

C = A^{T} A

$C = A^{T} A$

donde ha tenido la columna significa eliminada, luego vea que cuando forma , cuadra el número de condición. Así que mejor es formar los factores QR de en lugar de computar explícitamente una factorización de Cholesky de . $A$ $C$ $A$ $A^{T}A$

A = Q R

$A = QR$

Como Q es ortogonal,

\begin{aligned} C & = (Q R)^{T} Q R \\ = R^{T} Q^{T} Q R \\ = R^{T} I R \\ = R^{T} R \end{aligned}

$\begin{align} C &= (QR)^{T} QR \\ &= R^T Q^T QR \\ &= R^T I R \\ &= R^{T} R \end{align}$

Así obtenemos el factor Cholesky directamente de la factorización QR, en forma de . Si un -menos factorización QR está disponible, esto es aún mejor, ya que no es necesario . Un QR sin es algo rápido de calcular, ya que nunca se genera. Se convierte simplemente en una secuencia de transformaciones del Jefe de familia. (Una columna pivoteada, -less QR sería lógicamente aún más estable, a costa de un poco de trabajo extra para elegir los pivotes). $R^{T}$ $Q$ $Q$ $Q$ $Q$ $Q$

La gran virtud de usar el QR aquí es que es muy estable numéricamente en problemas desagradables. Nuevamente, esto se debe a que nunca tuvimos que formar la matriz de covarianza directamente para calcular el factor Cholesky. Tan pronto como forme el producto , cuadrará el número de condición de la matriz. Efectivamente, pierde información en las partes de esa matriz donde originalmente tenía muy poca información para comenzar. $A^{T}A$

Finalmente, como señala otra respuesta, ni siquiera necesita calcular y almacenar el inverso, sino usarlo implícitamente en forma de soluciones de retroceso en sistemas triangulares.

— carbono pentavalente
fuente

55

Y si necesita evaluar una forma cuadrática basada en , puede hacerlo de manera estable calculando , es decir, haciendo una sustitución hacia adelante y tomando la norma.

C^{- 1}

$C^{-1}$

⟨ x, C^{- 1} x ⟩ = ⟨ x, (R^{T} R)^{- 1} x ⟩ = ‖ R^{- T} x ‖^{2}

$\langle x,C^{-1}x\rangle = \langle x,(R^T R)^{-1}x\rangle = \|R^{-T}x\|^2$

— Christian Clason

3

Hice esto por primera vez recientemente, utilizando las sugerencias de mathSE.

SVD fue recomendado por la mayoría, creo, pero opté por la simplicidad de Cholesky:

Si la matriz , descompongo en una matriz triangular usando Cholesky, de modo que . Luego uso la sustitución hacia atrás o hacia adelante (dependiendo de si elijo que L sea triangular superior o inferior), para invertir , de modo que tenga . A partir de esto, puedo calcular rápidamente . $M = A A^\top$ $M$ $L$ $M = L L^\top$ $L$ $L^{-1}$ $M^{-1} = \left(L L^\top\right)^{-1} = L^{-\top}L^{-1}$

Empezar con:

$M = A A^\top$ , donde es conocido y es implícitamente simétrico y también es positivo-definido. $M$

Factorización de Cholesky:

$M \rightarrow L L^\top$ , donde es cuadrado y no singular $L$

Reemplazo de espalda:

$L \rightarrow L^{-1}$ , probablemente la forma más rápida de invertir (aunque no me cite en eso) $L$

Multiplicación:

$M^{-1} = \left(L L^\top\right)^{-1} = L^{-\top} L^{-1}$

Notación utilizada: los índices inferiores son filas, los índices superiores son columnas y es la transposición de $L^{-\top}$ $L^{-1}$

Mi algoritmo Cholesky (probablemente de Recetas Numéricas o Wikipedia)

$L_i^j = \frac{M_i^j - M_i \cdot M_j}{M_i^i - M_i \cdot M_i}$

Esto casi puede hacerse en el lugar (solo necesita almacenamiento temporal para los elementos diagonales, un acumulador y algunos iteradores enteros).

Mi algoritmo de sustitución de espalda (de Numerical Recipes, verifique su versión, ya que puede haber cometido un error con el marcado LaTeX)

$\left(L^{-1}\right)_i^j = \left\{\begin{array}{11} 1 / {L_i^i} & \mbox{if } i = j\\ \left(-L_i \cdot \left(L^{-T}\right)_j\right) / L_i^i & \mbox{otherwise} \end{array}\right.$

A medida que aparece en la expresión, el orden que itera sobre la matriz es importante (algunas partes de la matriz de resultados dependen de otras partes que deben calcularse de antemano). Consulte el código de Recetas numéricas para ver un ejemplo completo en código. [Editar]: En realidad, solo verifique el ejemplo de Recetas numéricas. He simplificado demasiado el uso de productos de punto, hasta el punto de que la ecuación anterior tiene una dependencia cíclica, sin importar el orden que repita ... $L^{-T}$

— Mark K Cowan
fuente

2

Si sabe que la matriz tiene un inverso (es decir, si es realmente positivo definido) y si no es demasiado grande, entonces la descomposición de Cholesky proporciona un medio apropiado para caracterizar el inverso de una matriz.

— Wolfgang Bangerth
fuente