¿Qué es la covarianza en lenguaje sencillo y cómo se relaciona con los términos dependencia , correlación y estructura de varianza-covarianza con respecto a los diseños de medidas repetidas?
¿Qué es la covarianza en lenguaje sencillo y cómo se relaciona con los términos dependencia , correlación y estructura de varianza-covarianza con respecto a los diseños de medidas repetidas?
Respuestas:
La covarianza es una medida de cómo los cambios en una variable están asociados con los cambios en una segunda variable. Específicamente, la covarianza mide el grado en que dos variables están asociadas linealmente. Sin embargo, a menudo también se usa informalmente como una medida general de cuán monotónicamente relacionadas están dos variables. Hay muchas explicaciones intuitivas útiles de covarianza aquí .
Con respecto a cómo se relaciona la covarianza con cada uno de los términos que mencionó:
(3) La estructura de varianza / covarianza (a menudo llamada simplemente la estructura de covarianza ) en los diseños de medidas repetidas se refiere a la estructura utilizada para modelar el hecho de que las mediciones repetidas en individuos están potencialmente correlacionadas (y por lo tanto son dependientes) - esto se hace modelando el entradas en la matriz de covarianza de las mediciones repetidas. Un ejemplo es la estructura de correlación intercambiable con varianza constante que especifica que cada medición repetida tiene la misma varianza, y todos los pares de mediciones están igualmente correlacionados. Una mejor opción puede ser especificar una estructura de covarianza que requiera dos mediciones tomadas más separadas en el tiempo para estar menos correlacionadas (p. Ej.Un modelo autorregresivo ). Tenga en cuenta que el término estructura de covarianza surge más generalmente en muchos tipos de análisis multivariados en los que se permite correlacionar las observaciones.
La respuesta de Macro es excelente, pero quiero agregar más a un punto de cómo la covarianza está relacionada con la correlación. La covarianza realmente no le dice acerca de la fuerza de la relación entre las dos variables, mientras que la correlación sí. Por ejemplo:
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
Ahora cambiemos la escala y multipliquemos x e y por 10
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
Cambiar la escala no debería aumentar la fuerza de la relación, por lo que podemos ajustar dividiendo las covarianzas entre las desviaciones estándar de x e y, que es exactamente la definición del coeficiente de correlación.
En los dos casos anteriores, el coeficiente de correlación entre x e y es 0.98198
.