Tomado de Estadísticas prácticas para la investigación médica donde Douglas Altman escribe en la página 285:
... para cualesquiera dos cantidades, X e Y, X se correlacionará con XY. De hecho, incluso si X e Y son muestras de números aleatorios, esperaríamos que la correlación de X e XY sea 0.7
Intenté esto en R y parece ser el caso:
x <- rnorm(1000000, 10, 2)
y <- rnorm(1000000, 10, 2)
cor(x, x-y)
xu <- sample(1:100, size = 1000000, replace = T)
yu <- sample(1:100, size = 1000000, replace = T)
cor(xu, xu-yu)
¿Porqué es eso? ¿Cuál es la teoría detrás de esto?