La respuesta de JohnRos es muy buena. En inglés simple, endogeneidad significa que se equivocó la causalidad. Que el modelo que anotó y estimó no capta adecuadamente la forma en que funciona la causalidad en el mundo real. Cuando escribes:
Yi=β0+β1Xi+ϵi
Puedes pensar en esta ecuación de varias maneras. Se podría considerar como una forma conveniente de predecir función de los valores deSe podría considerar como una forma conveniente de modelar . En cualquiera de estos casos, no existe la endogeneidad, y no necesita preocuparse por eso.X E { Y | X }YXE{Y|X}
Sin embargo, también puede pensar en la ecuación como una causalidad que encarna. Puede pensar en como la respuesta a la pregunta: "¿Qué le sucedería a si llegara a este sistema y aumentara experimentalmente en 1?" Si quiere pensarlo de esa manera, usar OLS para estimarlo equivale a suponer que: Y Xβ1YX
- YX causaY
- Yϵ causaY
- Xϵ no causaX
- XY no causaX
- Nada que cause también causaXϵX
La falla de cualquiera de 3-5 generalmente dará como resultado , o, no del todo equivalente, . Las variables instrumentales son una forma de corregir el hecho de que se equivocó la causalidad (haciendo otra suposición causal diferente). Un ensayo controlado aleatorio perfectamente realizado es una forma de obligar a 3-5 a ser verdad. Si elige al azar, entonces seguramente no es causado por , o cualquier otra cosa. Los llamados métodos de "experimento natural" son intentos de encontrar circunstancias especiales en el mundo donde 3-5 son verdaderas, incluso cuando no creemos que 3-5 sean verdaderas.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0Cov(X,ϵ)≠0XYϵ
En el ejemplo de JohnRos, para calcular el valor salarial de la educación, necesita una interpretación causal de , pero hay buenas razones para creer que 3 o 5 es falso.β1
Sin embargo, su confusión es comprensible. Es muy típico en los cursos sobre el modelo lineal que el instructor use la interpretación causal de que di anteriormente, mientras que no introducir causalidad, pretendiendo que "todo es solo estadística". Es una mentira cobarde, pero también es muy común. β1
De hecho, es parte de un fenómeno mayor en biomedicina y ciencias sociales. Casi siempre es el caso que estamos tratando de determinar el efecto causal de en --- de eso se trata la ciencia después de todo. Por otro lado, también es casi siempre el caso de que haya alguna historia que pueda contar que lleve a la conclusión de que uno de 3-5 es falso. Entonces, hay una especie de deshonestidad práctica, fluida y equívoca en la que rechazamos las objeciones al decir que solo estamos haciendo un trabajo de asociación y luego escabullimos la interpretación causal en otro lugar (normalmente en las secciones de introducción y conclusión del documento).YXY
Si estás realmente interesado, el chico a leer es Judea Perl. James Heckman también es bueno.
R
.