Si tenemos 2 variables aleatorias normales no correlacionadas entonces podemos crear 2 variables aleatorias correlacionadas con la fórmula
y luego tendrá una correlación con .ρ X 1
¿Alguien puede explicar de dónde viene esta fórmula?
Si tenemos 2 variables aleatorias normales no correlacionadas entonces podemos crear 2 variables aleatorias correlacionadas con la fórmula
y luego tendrá una correlación con .ρ X 1
¿Alguien puede explicar de dónde viene esta fórmula?
Respuestas:
Supongamos que desea encontrar una combinación lineal de y X 2 de modo que
Tenga en cuenta que si multiplica tanto como β por la misma constante (distinta de cero), la correlación no cambiará. Por lo tanto, vamos a agregar una condición para preservar la varianza: var ( α X 1 + β X 2 ) = var ( X 1 )
Esto es equivalente a
Asumiendo que ambas variables aleatorias tienen la misma varianza (¡esta es una suposición crucial!) ( ), obtenemos
Hay muchas soluciones para esta ecuación, por lo que es hora de recordar la condición de preservación de la varianza:
Y esto nos lleva a
UPD . Con respecto a la segunda pregunta: sí, esto se conoce como blanqueamiento .
La ecuación es una forma bivariada simplificada de descomposición de Cholesky . Esta ecuación simplificada a veces se llama algoritmo de Kaiser-Dickman (Kaiser y Dickman, 1962).
Tenga en cuenta que y X 2 deben tener la misma variación para que este algoritmo funcione correctamente. Además, el algoritmo se usa típicamente con variables normales. Si X 1 o X 2 no son normales, Y podría no tener la misma forma de distribución que X 2 .
Referencias
Kaiser, HF y Dickman, K. (1962). Muestra y matrices de puntuación de población y muestras de matrices de correlación de una matriz de correlación de población arbitraria Psychometrika, 27 (2), 179-182.