Medidas de similitud o distancia entre dos matrices de covarianza.


28

¿Hay alguna medida de similitud o distancia entre dos matrices de covarianza simétrica (ambas tienen las mismas dimensiones)?

Estoy pensando aquí en análogos a la divergencia KL de dos distribuciones de probabilidad o la distancia euclidiana entre vectores, excepto que se aplica a las matrices. Me imagino que habría bastantes medidas de similitud.

Idealmente, también me gustaría probar la hipótesis nula de que dos matrices de covarianza son idénticas.


3
Las respuestas a esta pregunta: quant.stackexchange.com/q/121/108 pueden ser de alguna utilidad.
shabbychef

2
excelente pregunta y respuesta en el enlace - gracias - Sí, esto es donde iba :)
Ram Ahluwalia

Respuestas:


21

Puede usar cualquiera de las normas (consulte Wikipedia en una variedad de normas; tenga en cuenta que la raíz cuadrada de la suma de las distancias al cuadrado, ABp , se llama norma Frobenius, y es diferente de lanormaL2, que es la raíz cuadrada del mayor valor propio de(A-B)2, aunque por supuesto lo harían generar la misma topología). La distancia KL entre las dos distribuciones normales con las mismas medias (digamos cero) y las dos matrices de covarianza específicas también está disponible enWikipediacomo1i,j(aijbij)2L2(AB)2.12[tr(A1B)ln(|B|/|A|)]

Editar: si una de las matrices es una matriz implícita en el modelo y la otra es la matriz de covarianza de muestra, entonces, por supuesto, puede formar una prueba de razón de probabilidad entre las dos. Mi colección favorita personal de tales pruebas para estructuras simples se da en Rencher (2002) Métodos de análisis multivariante . Casos más avanzados están cubiertos en el modelo de estructura de covarianza, en el cual un punto de partida razonable es Bollen (1989) Ecuaciones estructurales con variables latentes .


tengo un problema con : no da el mismo valor si se permutan A y B (una distancia real debería ser simétrica ) 1/2(tr(A1B)log(|B|/|A|))AB
user603

(AB)2 . (Adet(A)1/pBdet(B)1/p)2
user603

2
Primero, KL no es una distancia real, y ese es un hecho bien conocido. En segundo lugar, si las matrices se miden en unidades diferentes, no pueden ser iguales.
StasK

¿La distancia KL es similar a la razón de probabilidad, o están relacionadas?
hashmuke

7

Denote y Σ 2 sus matrices ambas de dimensión p .Σ1Σ2p

  1. Número Cond: donde λ 1 ( λ p ) es el más grande (el más pequeño) autovalor de Σ * , donde Σ * se define como: Σ * : = Σ - 1 / 2 1 Σ 2 Σ - 1 / 2 1log(λ1)log(λp)λ1λpΣΣΣ:=Σ11/2Σ2Σ11/2

Editar: edité la segunda de las dos propuestas. Creo que había entendido mal la pregunta. La propuesta basada en números de condición se usa mucho en estadísticas sólidas para evaluar la calidad del ajuste. Una fuente antigua que pude encontrar es:

Yohai, VJ y Maronna, RA (1990). El sesgo máximo de covarianzas robustas. Comunicaciones en estadística: teoría y métodos, 19, 3925–2933.

Originalmente había incluido la medida de la relación Det:

  1. Det ratio: dondeΣ =(Σ1+Σ2)/2.log(det(Σ)/det(Σ2)det(Σ1))Σ=(Σ1+Σ2)/2

que sería la distancia Bhattacharyya entre dos distribuciones gaussianas que tienen el mismo vector de ubicación. Debo haber leído originalmente la pregunta como perteneciente a un entorno donde las dos covarianzas provenían de muestras de poblaciones que se suponía que tenían los mismos medios.


7

d=1tr(R1R2)R1R2,


+1. Muchas gracias por esta respuesta, fue muy útil para mí.
ameba dice Reinstate Monica

1
Esta es una similitud de coseno menos, ¿verdad?
Firebug

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.