Un contraejemplo
El problema no parece ser esa independencia media (la condición donde E[Y|X]=E[Y]) implica que Y y Xno están correlacionados SiX y Yno están correlacionados, generalmente no es cierto que sean independientes de la media. Entonces, esto no parece problemático hasta ahora.
Sin embargo, suponga que tiene una relación (podemos llamarla causal) definida como Y=WX, dónde X se distribuye con una distribución normal estándar y W se distribuye con una distribución Rademacher para que W=1 o −1, cada uno con probabilidad 1/2( ver este artículo de Wikipedia ). Entonces note queE[Y|X]=E[Y]. Según su definición, esta relación no sería causa aunqueY claramente depende de X.
Un ejemplo de una forma formal de pensar sobre la causalidad
Para darle una forma más clara y matemática de ver la causalidad, tome el siguiente ejemplo. (Tomo prestado este ejemplo del libro "Econometría principalmente inofensiva"). Suponga que desea analizar el efecto de la hospitalización en la salud. DefinirYi como alguna medida de salud del individuo i y Di∈{0,1}para indicar si ese individuo fue hospitalizado o no. En nuestro primer intento, supongamos que observamos la diferencia promedio en la salud de los dos tipos de individuos:
E[Yi|Di=1]−E[Yi|Di=0].
Al observar los datos por primera vez, puede notar, en contra de la intuición, que las personas que han sido hospitalizadas en realidad tienen peor salud que las que no. Sin embargo, ir al hospital ciertamente no enferma a las personas. Más bien, hay un sesgo de selección. Las personas que van al hospital son aquellas que tienen peor salud. Entonces esta primera medida no funciona. ¿Por qué? Porque no estamos interesados solo en lo
observado diferencias , sino en las diferencias potenciales (queremos saber qué sucedería en el mundo contrafactual).
Defina el resultado potencial de cualquier individuo de la siguiente manera:
Potential Outcome={Y1,iY0,iif Di=1if Di=0.
Y0,i es la salud del individuo
i si no hubiera ido al hospital, independientemente de si realmente fue o no (queremos pensar en hechos hipotéticos) y de la misma manera,
Y1,ies la salud del individuo si se fue. Ahora, escriba el resultado real observado en términos de potenciales,
Yi={Y1,iY0,iif Di=1if Di=0.
Así,
Yi=Y0,i+(Y1,i−Y0,i)Di. Ahora, podemos definir el efecto causal como
Y1,i−Y0,i. Esto funciona porque es en términos de potenciales. Ahora, supongamos que miramos nuevamente las diferencias observadas en la salud promedio:
E[Yi|Di=1]−E[Yi|Di=0]=E[Y1,i|Di=1]−E[Y0,i|Di=1]+E[Y0,i|Di=1]−E[Y0,i|Di=0].
Tenga en cuenta que el término
E[Y1,i|Di=1]−E[Y0,i|Di=1] puede interpretarse como el efecto promedio del tratamiento sobre el tratamiento y
E[Y0,i|Di=1]−E[Y0,i|Di=0]como el sesgo en la selección. Ahora si el tratamiento
Di se asigna al azar, entonces tenemos
E[Yi|Di=1]−E[Yi|Di=0]=E[Y1,i|Di]−E[Y0,i|Di=0]=E[Y1,i|Di]−E[Y0,i|Di=1]=E[Y1,i−Y0,i|Di=1]=E[Y1,i−Y0,i],
donde vemos eso
E[Y1,i−Y0,i] es el efecto causal promedio que nos interesa. Esta es una forma básica de pensar sobre la causalidad.