Si X e Y son variables aleatorias y a y b son constantes, entonces
Cov(X+a,Y+b)=E[(X+a−E[X+a])(Y+b−E[Y+b])]=E[(X+a−E[X]−E[a])(Y+b−E[Y]−E[b])]=E[(X+a−E[X]−a)(Y+b−E[Y]−b)]=E[(X−E[X])(Y−E[Y])]=Cov(X,Y).
Centrado está el caso especiala = -E[X]yb = -E[Y], por lo que el centrado no afecta a la covarianza.
Además, dado que la correlación se define como
Corr(X,Y) =Cov(X,Y)Var(X)Var(Y)------------√,
podemos ver que
Corr(X+ a ,Y+ b )=Cov(X+ a ,Y+ b )Var(X+ a )Var(Y+ b )------------------√=Cov(X,Y)Var(X)Var(Y)------------√,
por lo que,en particular, la correlación tampoco se ve afectada por el centrado.
Esa fue la versión de la población de la historia. La versión de muestra es la misma: si usamos
Covˆ( X, Y) = 1norte∑i = 1norte( Xyo- 1norte∑j = 1norteXj) ( Yyo- 1norte∑j = 1norteYj)
como nuestra estimación de covarianza entreXeYpartir de una muestra emparejada( X1, Y1) , … , ( Xnorte, Ynorte), entonces
Covˆ( X+ a , Y+ b )= 1norte∑i = 1norte( Xyo+ a - 1norte∑j = 1norte( Xj+ a ) ) ( Yyo+ b - 1norte∑j = 1norte( Yj+ b ) )= 1norte∑i = 1norte( Xyo+ a - 1norte∑j = 1norteXj- nnortea ) ( Yyo+ b - 1norte∑j = 1norteYj- nnorteb )= 1norte∑i = 1norte( Xyo- 1norte∑j = 1norteXj) ( Yyo- 1norte∑j = 1norteYj)= Covˆ( X, Y)
para cualquierunaysi.