La correlación es la covarianza estandarizada , es decir, la covarianza de X yy dividida por la desviación estándar deX ey . Déjame ilustrar eso.
En términos generales, las estadísticas se pueden resumir como modelos adecuados para los datos y evaluar qué tan bien el modelo describe esos puntos de datos ( Resultado = Modelo + Error ). Una forma de hacerlo es calcular las sumas de desviaciones o residuales (res) del modelo:
r e s = ∑ ( xyo- x¯)
Muchos cálculos estadísticos se basan en esto, incl. El coeficiente de correlación (ver abajo).
Aquí hay un conjunto de datos de ejemplo realizado R
(los residuos se indican como líneas rojas y sus valores se agregan junto a ellos):
X <- c(8,9,10,13,15)
Y <- c(5,4,4,6,8)
Al observar cada punto de datos individualmente y restar su valor del modelo (por ejemplo, la media; en este caso X=11
Y=5.4
SS
SS= ∑ ( xyo- x¯) ( xyo- x¯) = ∑ ( xyo- x¯)2
n - 1s2
s2= SSn - 1= ∑ ( xyo- x¯) ( xyo- x¯)n - 1= ∑ ( xyo- x¯)2n - 1
Por conveniencia, se puede tomar la raíz cuadrada de la varianza de la muestra, que se conoce como la desviación estándar de la muestra:
s = s2--√=SSn - 1---√= ∑ ( xyo- x¯)2n - 1-------√
Ahora, la covarianza evalúa si dos variables están relacionadas entre sí. Un valor positivo indica que cuando una variable se desvía de la media, la otra variable se desvía en la misma dirección.
c o vx , y= ∑ ( xyo- x¯) ( yyo- y¯)n - 1
r . Esto permite comparar variables entre sí que se midieron en diferentes unidades. El coeficiente de correlación es una medida de la fuerza de una relación que varía de -1 (una correlación negativa perfecta) a 0 (sin correlación) y +1 (una correlación positiva perfecta).
r = c o vx , ysXsy= ∑ ( x1- x¯) ( yyo- y¯)( n - 1 ) sXsy
r = 0,87X
Y
En resumen, sí, tu sensación es correcta, pero espero que mi respuesta pueda proporcionar algún contexto.