Si X e Y son variables aleatorias y a y b son constantes, entonces
Cov(X+a,Y+b)=E[(X+a−E[X+a])(Y+b−E[Y+b])]=E[(X+a−E[X]−E[a])(Y+b−E[Y]−E[b])]=E[(X+a−E[X]−a)(Y+b−E[Y]−b)]=E[(X−E[X])(Y−E[Y])]=Cov(X,Y).
Centrado está el caso especial
a = -E[X]y
b = -E[Y], por lo que el centrado no afecta a la covarianza.
Además, dado que la correlación se define como
Corr(X,Y) =Cov(X,Y)Var(X)Var(Y)------------√,
podemos ver que
Corr(X+ a ,Y+ b )=Cov(X+ a ,Y+ b )Var(X+ a )Var(Y+ b )------------------√=Cov(X,Y)Var(X)Var(Y)------------√,
por lo que
,en particular, la correlación tampoco se ve afectada por el centrado.
Esa fue la versión de la población de la historia. La versión de muestra es la misma: si usamos
Covˆ( X, Y) = 1norte∑i = 1norte( Xyo- 1norte∑j = 1norteXj) ( Yyo- 1norte∑j = 1norteYj)
como nuestra estimación de covarianza entre
Xe
Ypartir de una muestra emparejada
( X1, Y1) , … , ( Xnorte, Ynorte), entonces
Covˆ( X+ a , Y+ b )= 1norte∑i = 1norte( Xyo+ a - 1norte∑j = 1norte( Xj+ a ) ) ( Yyo+ b - 1norte∑j = 1norte( Yj+ b ) )= 1norte∑i = 1norte( Xyo+ a - 1norte∑j = 1norteXj- nnortea ) ( Yyo+ b - 1norte∑j = 1norteYj- nnorteb )= 1norte∑i = 1norte( Xyo- 1norte∑j = 1norteXj) ( Yyo- 1norte∑j = 1norteYj)= Covˆ( X, Y)
para cualquier
unay
si.