¿No correlación no implica causalidad?


73

Sé que la correlación no implica causalidad, pero ¿la ausencia de correlación implica ausencia de causalidad?


46
Para citar a Andrew Gelman, "la correlación ni siquiera implica correlación".
Mike Hunter

9
No. A puede ser la causa de B, pero solo lo afecta de forma no lineal.
Neil G

3
"La correlación se correlaciona con la causalidad. (Simplemente no mucho.)"
Adrian

77
Por favor, mire esta página para el contrapositivo. Si la causalidad no implica correlación, entonces ninguna correlación no implica ninguna causalidad.
EdM

44
Si bien es un buen comienzo señalar que la correlación no implica causalidad, y luego discutir los detalles, hace mucho que he pensado ¿por qué señalar la correlación? Lo atribuí a asonancia, y la idea atractiva para los maestros (yo también) de que los estudiantes con cierto esfuerzo pueden recordar un eslogan y usarlo en su pensamiento. Pero la verdad es que no mucho en estadística implica causalidad. Dicho de otro modo, esta advertencia a menudo viene en el capítulo de correlación o en la conferencia de correlación, pero pertenece a todas partes.
Nick Cox

Respuestas:


76

¿una ausencia de correlación implica ausencia de causalidad?

No. Cualquier sistema controlado es un contraejemplo.

Sin relaciones causales, el control es claramente imposible, pero el control exitoso significa, en términos generales, que cierta cantidad se mantiene constante, lo que implica que no se correlacionará con nada, incluidas las cosas que hacen que sea constante.

Entonces, en esta situación, concluir que no existe una relación causal por falta de correlación sería un error.

Aquí hay un ejemplo algo tópico .


Una forma intuitiva de pensarlo
Repmat

+1, toma interesante. Sin embargo, parece implicar que la causalidad podría estar presente mientras no exista correlación de ningún tipo. Eso no puede ser verdad. Si algún evento causa otro, habrá algún "tipo de correlación presente, el _constante que usted mencionó será en forma de correlación no lineal
Aksakal

1
+1 Bra vo! Cuando vi el título de la pregunta en la barra lateral, estaba todo "Esto necesita respuesta desde una perspectiva de sistemas". Lo lograste.
Alexis

Si de una ausencia de correlación se elimina la causalidad, ¿será el funcionamiento restante candidato para etiquetar "casualidad"?
ttnphns

1
No estoy seguro de entender la pregunta de @ttnphns, pero creo que la respuesta es: si rompe el cable del freno (o desconecta el pedal del acelerador), las colinas comenzarán a mostrar su impacto causal en la velocidad de un automóvil.
conjugateprior

30

No. Principalmente porque por correlación lo más probable es que se refiera a correlación lineal . Dos variables pueden correlacionarse de forma no lineal y pueden no mostrar correlación lineal . Es fácil construir un ejemplo como ese, pero te daré un ejemplo que está más cerca de tu pregunta (más estrecha).

Veamos la variable aleatoria , y la función no aleatoria f ( x ) = x 2 , con la cual creamos una variable aleatoria y = f ( x ) . La última es claramente causada por la primera variable, no solo correlacionada. Dibujemos un diagrama de dispersión:XF(X)=X2y=F(X)

ingrese la descripción de la imagen aquí

Imagen clara y clara de correlación no lineal , pero en este caso también es causalidad directa. Sin embargo, el coeficiente de correlación lineal no es significativo, es decir, no hay correlación lineal a pesar de la correlación no lineal obvia, e incluso la causalidad:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

ACTUALIZACIÓN: @Kodiologist tiene razón en el comentario. Se puede demostrar matemáticamente que el coeficiente de correlación lineal para estas dos variables es de hecho cero. En mi ejemplo, es la variable normal estándar, por lo que tenemos lo siguiente: E [ x ] = 0 E [ x 2 ] = 1 E [ x x 2 ] = E [ x 3 ] = 0 Por lo tanto, la covarianza (y posteriormente la correlación) es cero: C o v [ x , x 2X

mi[X]=0 0
mi[X2]=1
mi[XX2]=mi[X3]=0 0
Cov[X,X2]=mi[XX2]-mi[X]mi[X2]=0 0

Obtendríamos el mismo resultado para cualquier distribución simétrica, como el uniforme .U[-1,1]


8
La no significancia no implica la verdad de la hipótesis nula. Lo importante en su ejemplo es que el coeficiente de correlación de la población es 0.
Kodiologist

1
¿Por qué crees que el OP significa correlación lineal?
user253751

@immibis, porque la causalidad debe dar lugar a algún tipo de correlación no lineal.
Aksakal

¿Por qué la correlación es cero? La covarianza es , y en general para una variable aleatoria X luego E [ X 3 ] E [ X 2 ] E [ X ] .. Se cumple para X estándar aunque normalE[X3]E[X2]E[X]Xmi[X3]mi[X2]mi[X]X
Ant

@Ant, estoy usando normal estándar para en el ejemplo de MATLAB. Actualicé mi publicación para dejarlo claro. Gracias por mencionarlo. X
Aksakal

18

No se . En particular, las variables aleatorias pueden ser dependientes pero no correlacionadas.

X[-1,1]YX-XXYX[-1,1]YX=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

XY

Corr(X,Y)=Cov(X,Y)σXσY=mi[XY]-mi[X]mi[Y]σXσY=0 0-0 00 0σXσY=0.

1
En realidad, este es un mal ejemplo en mi opinión. X no causa Y. Una variable binaria ausente del modelo PresenceOfX es la causa real con una correlación de 1. Lo que demuestra es que el valor de X no influye en Y.
user2088176

66
XY

55
XYXYX=12Y12-12X=34 4Y34 4-34 4XYXY

1
X[0 0,1]

3
Xnorte(0 0,1)X2χ2(1)X2X

14

Tal vez mirarlo desde una perspectiva computacional ayudará.

Como ejemplo concreto, tome un generador de números pseudoaleatorio.

kth

¿Hay alguna correlación medible?


7

La mejor respuesta a la pregunta es que la correlación es una relación estadística, matemática y / o física, mientras que la causalidad es una relación metafísica. Lógicamente, no se puede pasar de la correlación (o no correlación) a la causalidad, sin un conjunto (grande) de supuestos que vinculan la metafísica a la física. (Un ejemplo es que lo que dos personas podrían aceptar ser "un observador racional" es en gran medida arbitrario y probablemente ambiguo). Si A paga a B para hacer C, lo que resulta en D, ¿cuál es la causa de D? Simplemente no hay una razón racional para elegir C, B o A (o cualquiera de los eventos precursores de A). La teoría de control trata con sistemas en reinos donde están bajo control. Una forma de tener una variable dependiente bajo control es reducir la respuesta de esa variable al posible rango de variación (controlada) de la variable independiente al ruido estadístico. Por ejemplo, sabemos que la presión del aire se correlaciona con la salud (solo intente respirar vacío), pero si controlamos la presión del aire a 1 +/- 0.001 atm, ¿qué tan probable es que CUALQUIER variación de la presión del aire afecte la salud?


La distinción que busca es "observada en una muestra" (correlación) versus dependencia que existe independientemente de si se observa o no en una muestra (física). No hay un papel para la metafísica en esta explicación (aunque algunos para la suposición física). Los resortes tienen límites elásticos, los alcancen o no. O en un ejemplo más hogareño: un cubo de azúcar es soluble, un concepto claramente causal que implica, aproximadamente, que si lo deja caer en el té, se disolverá. Pero esta propiedad causal se debe únicamente a su estructura física . Los terrones de azúcar serían solubles incluso si nunca pensáramos disolver ninguno de ellos.
conjugateprior

1
Tiene razón, por supuesto, que sin suposiciones causales en un argumento, no se sacan conclusiones causales. ¡Pero realmente no hay nada muy metafísico en eso!
conjugateprior

Por otro lado, la teoría contrafáctica de la causalidad (por ejemplo, Pearl o Woodward) está diseñada exactamente para dar sentido a "Si A paga a B para hacer C que da como resultado D, ¿cuál es la causa de D? Simplemente no hay una razón racional para elegir C, B o A" . La única noción pasada de moda y no útil que estas teorías dejan de lado es que siempre podemos reconocer la idea de que existe la causa de algo. Por supuesto que no.
conjugateprior

5

, contrario a las respuestas anteriores. Voy a tomar la pregunta como no técnica, particularmente la definición de "correlación". Tal vez lo estoy usando demasiado ampliamente, pero veo mi segunda bala. Espero que se considere apropiado discutir otras respuestas aquí, porque iluminan diferentes partes de la pregunta. Me estoy basando en el enfoque de Pearl sobre la causalidad, y en particular en mi opinión sobre algunos documentos con Kevin Korb. Woodward probablemente tiene la explicación no técnica más clara.

  • XyXyXyyXy

  • y=X2yXXyXy

  • y=UnorteyoF(X,-X)El |yEl |=El |XEl |

  • π

  • UNAsiCreUNAre pero la correlación está ahí porque hay una historia causal.

No sé lo que @ user2088176 tenía en mente, pero creo que si tomamos la pregunta de manera muy general, la respuesta es sí. Al menos creo que esa es la respuesta requerida de la literatura de descubrimiento causal y la explicación intervencionista de la causalidad. Las causas son diferencias que marcan la diferencia. Y esa diferencia se revelará, en algún experimento, como asociación persistente.


1
Tenía la esperanza de abordar esto desde una perspectiva más simple y no técnica, como usted. ¿Qué significa "causa"? Presumiblemente implica un cambio en algo que conduce a un cambio en otra cosa. No puedo entender la causalidad sin algún tipo de correlación.
Behacad

1
@Behacad Creo que el contraste es entre algún tipo de correlación (el tipo de cosa que se puede observar) y algún tipo de dependencia (que puede que nunca se active). Hay dependencias no activadas pero no hay correlaciones no observadas. Esta es la razón por la cual la causalidad tiene un elemento contrafactual en su definición, mientras que la correlación no.
conjugateprior
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.