[Lo siguiente tal vez parezca un poco técnico debido al uso de ecuaciones, pero se basa principalmente en los gráficos de flechas para proporcionar la intuición que solo requiere una comprensión muy básica de OLS, así que no te repulses.]
Suponga que desea estimar el efecto causal de sobre y i dado por el coeficiente estimado para β , pero por alguna razón existe una correlación entre su variable explicativa y el término de error:xiyiβ
yi=α+βxi+↖corrϵi↗
Esto podría haber sucedido porque olvidamos incluir una variable importante que también se correlaciona con . Este problema se conoce como sesgo de variables omitidas y su β no le dará el efecto causal (ver aquí para más detalles). Este es un caso en el que desea utilizar un instrumento porque solo entonces puede encontrar el verdadero efecto causal.xiβˆ
Un instrumento es una nueva variable que no está correlacionada con ϵ i , pero que se correlaciona bien con x i y que solo influye en y i a través de x i , por lo que nuestro instrumento es lo que se llama "exógeno". Es como en este cuadro aquí:ziϵixiyixi
zyo→Xyo↑ϵyo→↗yyo
Entonces, ¿cómo usamos esta nueva variable?
Tal vez recuerdes la idea de tipo ANOVA detrás de la regresión, donde divides la variación total de una variable dependiente en un componente explicado y un componente no explicado. Por ejemplo, si regresas tu en el instrumento,Xyo
Xyototal variation=a+πziexplained variation+ηiunexplained variation
entonces usted sabe que la variación explicada aquí es exógena a nuestra ecuación original porque depende solo de la variable exógena . Entonces, en este sentido, dividimos nuestro x i en una parte que podemos afirmar que es ciertamente exógena (esa es la parte que depende de z i ) y alguna parte inexplicada η i que mantiene toda la variación mala que se correlaciona con ϵ i . Ahora tomamos la parte exógena de esta regresión, la llamamos ^ x i ,zixiziηiϵixiˆ
xi=a+πzigood variation=xˆi+ηibad variation
y poner esto en nuestra regresión original:
yi=α+βxˆi+ϵi
Ahora bien, como x i no se correlaciona más con ε i (recuerda, que "han filtrado" esta parte de x i y lo dejó en η i ), se puede estimar consistentemente nuestra β porque el instrumento nos ha ayudado a romper la correlación entre el explicativo de forma variable y el error. Esta fue una forma de aplicar variables instrumentales. Este método en realidad se llama mínimos cuadrados de 2 etapas, donde nuestra regresión de x i en z i se llama "primera etapa" y la última ecuación aquí se llama "segunda etapa".xˆiϵixiηiβxizi
En términos de nuestra imagen original (dejo el para no hacer un lío pero recuerda que está ahí!), En lugar de tomar la ruta directa, pero errónea entre x i a y yo hemos dado un paso intermedio a través de x iϵixiyixˆi
zi→xi↗→xˆi↓yi
Gracias a esta ligera desviación de nuestro camino hacia el efecto causal, pudimos estimar consistentemente utilizando el instrumento. El costo de esta desviación es que los modelos de variables instrumentales son generalmente menos precisos, lo que significa que tienden a tener errores estándar más grandes.β
¿Cómo encontramos instrumentos?
Esa no es una pregunta fácil porque necesita hacer un buen caso de por qué su no estaría correlacionado con ϵ i ; esto no se puede probar formalmente porque el verdadero error no se observa. Por lo tanto, el desafío principal es encontrar algo que pueda ser visto como exógeno, como los desastres naturales, los cambios en las políticas o, a veces, incluso puede realizar un experimento aleatorio. Las otras respuestas tenían algunos muy buenos ejemplos para esto, así que no repetiré esta parte.ziϵi