En los comentarios, se sugirieron 15 formas de entender el coeficiente de correlación:
Las 13 formas discutidas en el artículo de Rodgers y Nicewander (The American Statistician, febrero de 1988) son
Una función de puntajes y medias en bruto,
r = ∑ ( Xyo- X¯) ( Yyo−Y¯)∑(Xi−X¯)2(Yi−Y¯)2−−−−−−−−−−−−−−−−−−√.
Covarianza estandarizada
r=sXY/(sXsY)
donde es covarianza de muestra y s X y s Y son desviaciones estándar de muestra.sXYsXsY
Pendiente estandarizada de la línea de regresión,
r=bY⋅XsXsY=bX⋅YsYsX,
donde y b X ⋅ Y son las pendientes de las líneas de regresión.bY⋅XbX⋅Y
La media geométrica de las dos pendientes de regresión,
r=±bY⋅XbX⋅Y−−−−−−−√.
La raíz cuadrada de la razón de dos variaciones (proporción de variabilidad contabilizada),
r=∑(Yi−Yi^)2∑(Yi−Y¯)2−−−−−−−−−−−−⎷=SSREGSSTOT−−−−−−√=sY^sY.
El producto cruzado medio de variables estandarizadas,
r=∑zXzY/N.
Una función del ángulo entre las dos líneas de regresión estandarizadas. Las dos líneas de regresión (de vs. X y X vs. Y ) son simétricas respecto a la diagonal. Deje que el ángulo entre las dos líneas sea β . LuegoYXXYβ
r=sec(β)±tan(β).
Una función del ángulo entre los dos vectores variables,
r=cos(α).
Una variación reescalada de la diferencia entre los puntajes estandarizados. Dejar que sea la diferencia entre estandarizados X y Y variables para cada observación,zY−zXXY
r=1−s2(zY−zX)/2=s2(zY+zX)/2−1.
Estimado a partir de la regla del "globo",
r≈1−(h/H)2−−−−−−−−−√
HX−YhX
En relación a las elipses bivariadas de isoconcentración,
r=D2−d2D2+d2
Ddr also equals the slope of the tangent line of an isocontour (in standardized coordinates) at the point the contour crosses the vertical axis.
A Function of Test Statistics from Designed Experiments,
r=tt2+n−2−−−−−−−−√
where t is the test statistic in a two-independent sample t test for a designed experiment with two treatment conditions (coded as X=0,1) and n is the combined total number of observations in the two treatment groups.
The Ratio of Two Means. Assume bivariate normality and standardize the variables. Select some arbitrarily large value Xc of X. Then
r=E(Y|X>Xc)E(X|X>Xc).