¿El centrado medio reduce la covarianza?


11

Suponiendo que tengo dos variables aleatorias no independientes y quiero reducir la covarianza entre ellas tanto como sea posible sin perder demasiada "señal", ¿significa centrar la ayuda? Leí en alguna parte que el centrado medio reduce la correlación en un factor significativo, por lo que creo que debería hacer lo mismo para la covarianza.

Respuestas:


30

Si X e Y son variables aleatorias y a y si son constantes, entonces

Cov(X+a,Y+b)=E[(X+aE[X+a])(Y+bE[Y+b])]=E[(X+aE[X]E[a])(Y+bE[Y]E[b])]=E[(X+aE[X]a)(Y+bE[Y]b)]=E[(XE[X])(YE[Y])]=Cov(X,Y).
Centrado está el caso especialuna=-mi[X]ysi=-mi[Y], por lo que el centrado no afecta a la covarianza.


Además, dado que la correlación se define como

Corr(X,Y)=Cov(X,Y)Var(X)Var(Y),
podemos ver que
Corr(X+una,Y+si)=Cov(X+una,Y+si)Var(X+una)Var(Y+si)=Cov(X,Y)Var(X)Var(Y),
por lo que,en particular, la correlación tampoco se ve afectada por el centrado.


Esa fue la versión de la población de la historia. La versión de muestra es la misma: si usamos

Cov^(X,Y)=1norteyo=1norte(Xyo-1nortej=1norteXj)(Yyo-1nortej=1norteYj)
como nuestra estimación de covarianza entreXeYpartir de una muestra emparejada(X1,Y1),...,(Xnorte,Ynorte), entonces
Cov^(X+una,Y+si)=1norteyo=1norte(Xyo+una-1nortej=1norte(Xj+una))(Yyo+si-1nortej=1norte(Yj+si))=1norteyo=1norte(Xyo+una-1nortej=1norteXj-nortenorteuna)(Yyo+si-1nortej=1norteYj-nortenortesi)=1norteyo=1norte(Xyo-1nortej=1norteXj)(Yyo-1nortej=1norteYj)=Cov^(X,Y)
para cualquierunaysi.


gracias por la respuesta detallada. ¿Significa que para la covarianza de la muestra el tamaño de la muestra tampoco tiene ningún impacto? es decir, reducir el tamaño de la muestra no reduce la covarianza de la muestra?
lvdp

3
@lvdp Esa probablemente debería ser una pregunta separada.
Acumulación

Un tamaño de muestra reducido solo puede venir con una muestra diferente. Una muestra diferente podría mostrar diferentes covarianzas, por lo tanto. Pero como la covarianza de la muestra se define como un promedio, el tamaño de la muestra se escala en principio.
Nick Cox

5

XYmi[(X-mi[X])(Y-mi[Y])]X-mi[X]XXcuando tomamos la covarianza, y el centrado es un operador idempotente; una vez que una variable está centrada, aplicar el proceso de centrado más veces no la cambia. Si la fórmula no tomara las versiones centradas de las variables, entonces habría todo tipo de efectos extraños, como que la covarianza entre la temperatura y otra variable sea diferente dependiendo de si medimos la temperatura en grados Celsius o Kelvin.


3

"en algún lugar" tiende a ser una fuente poco confiable ...

La covarianza / correlación se define con un centrado explícito . Si no centra los datos, entonces no está calculando covarianza / correlación. (Precisamente: correlación de Pearson)

La principal diferencia es si usted se centra en un modelo teórico (por ejemplo, se supone que el valor esperado es exactamente 0) o en los datos (media aritmética). Es fácil ver que la media aritmética producirá una covarianza más pequeña que cualquier centro diferente.

Sin embargo, una covarianza menor no implica una correlación menor, o lo contrario. Supongamos que tenemos datos X = (1,2) e Y = (2,1). Es fácil ver que con el centro aritmético de la media esto producirá una correlación perfectamente negativa, mientras que si sabemos que el proceso de generación produce 0 en promedio, los datos están realmente correlacionados positivamente. Entonces, en este ejemplo, estamos centrando, pero con el valor teórico esperado de 0.

Esto puede surgir fácilmente. Considere que tenemos una matriz de sensores, 11x11, con las celdas numeradas de -5 a +5. En lugar de tomar la media aritmética, tiene sentido usar la media "física" de nuestra matriz de sensores aquí cuando buscamos la correlación de los eventos del sensor (si enumeramos las celdas 0 a 10, usaríamos 5 como media fija, y obtendríamos los mismos resultados exactos, de modo que la opción de indexación desaparezca del análisis, bueno).


Gracias @ Anony-Mousse, ¿la covarianza de la muestra dependerá del tamaño de la muestra? Es decir, un tamaño de muestra más pequeño producirá una covarianza menor (antes del centrado).
lvdp

1
Depende de la muestra obviamente. En promedio, no lo sé. Esperaría que las muestras más pequeñas tengan mayor variabilidad en su mayoría, por lo que tal vez más a menudo valores más extremos. Pero eso es solo una intuición.
HA SALIDO - Anony-Mousse
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.