¿Por qué usar un DV rezagado como variable instrumental?


12

He heredado un código de análisis de datos que, al no ser econométrico, me cuesta entenderlo. Un modelo ejecuta una regresión de variables instrumentales con el siguiente comando Stata

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

Este conjunto de datos es un panel con múltiples observaciones secuenciales para este conjunto de variables.

¿Por qué este código usa los valores rezagados del DV como instrumentos? Según tengo entendido (al excavar en un libro de texto antiguo), la estimación IV se usa cuando hay un problema debido a que un regresor está correlacionado con el término de error. Sin embargo, no se menciona nada sobre la elección de los retrasos del DV como instrumentos.

Un comentario en esta línea del código menciona "causalidad". Cualquier ayuda para descubrir cuál era el objetivo aquí sería muy bienvenida.


De su pregunta, puede estar leyendo el código ligeramente equivocado. La sintaxis utiliza las diferencias como "instrumentos" para estimar el retraso de la variable dependiente.
Andy W

lara: ¿podrías editar tu pregunta para explicar en términos simples el significado del código stata recortado?
user603

Respuestas:


7

Editar: Dada la aclaración sobre el código de estado proporcionado por Andy W a continuación, cambié mi respuesta para abordar mejor la pregunta. Encontrará la versión anterior de mi respuesta debajo de la actual.

Parece que su código es un torpe intento de hacer bricolaje con el estimador de Arellano-Bond (suponiendo estimaciones de ivreg con 2SOLS). Puede encontrar más detalles sobre el uso y la lógica del estimador A / B en este bonito artículo de revisión , así como en esta introducción más amplia.

En pocas palabras y dentro de 3 líneas: aunque el estimador A / B es de hecho un estimador IV (generalizado), no se utiliza para abordar ningún problema de causalidad. Los IV en este contexto se utilizan para proporcionar una estimación eficiente del coeficiente AR en el contexto de los datos del panel.

Recomendaría no reinventar la rueda aquí, y en su lugar usar la caja de herramientas preparada para realizar tales estimaciones. Para stata, puede usar el paquete XTABOND2 (o XTABOND si está ejecutando STAT11).


vieja respuesta:

Un simple ejemplo te ayudará aquí. Suponga que tiene dos variables e muestreadas a lo largo del tiempo, de modo que la correlación entre y es muy alta. hacer un reclamo sobre causando pero desafortunadamente hay una muy buena teoría competitiva y creíble bajo la cual causa .xtytxtytxtytytxt

Para desenredar los dos modelos de la competencia, debe retroceder en (en lugar de ). A menudo, perderá precisión (es decir, la correlación entre las variables muestreadas en diferentes momentos suele ser menor que la correlación entre las variables muestreadas simultáneamente).ytxt1xt

La forma en que los dos modelos competidores - y - ahora están desenredados es que, presumiblemente, no hay una buena teoría bajo la cual una de uno Hace un período puede ser causado por una corriente ("el pasado no puede ser causado por el futuro"), excluyendo el segundo sentido de causalidad.ytxt1xt1ytxy

Tenga en cuenta que el uso de este truco solo es válido si ambas variables ( y son estacionarias ).ytxt1I(0)


+1 De acuerdo con esta interpretación acerca de que parece DIY Arellano-Bond. NB: He encontrado que Arellano-Bond es confiable solo cuando el número de unidades de sección transversal es muy grande, como en muchos cientos. Arellano lo insinúa tanto en sus artículos como en su libro de texto al indicar que la consistencia está en el número de unidades de sección transversal y que la tasa de convergencia no es tan rápida.
Cyrus S

5

No conozco a Stata, así que no puedo comentar sobre el modelo específico. Pero el uso de variables rezagadas es un enfoque bastante común cuando se trata del sesgo de simultaneidad en general y se crean variables instrumentales en particular.

Supongamos que tiene una retroalimentación entre dos variables en su modelo: la variable independiente (como el precio) y la variable dependiente (como la cantidad). Entonces, ambos son endógenos (sus causas surgen dentro del modelo) y las perturbaciones del término de error afectarán a ambas variables.

Para resolver esto, desea hacer que la variable independiente (precio) sea exógena para que las perturbaciones en el error afecten solo a la variable dependiente (cantidad). Esto se logra creando nuevas variables exógenas haciendo retroceder las otras variables exógenas en su modelo en el precio. Estas nuevas variables exógenas son sus variables instrumentales (IV). Los IV se derivan de términos exógenos y, por lo tanto, no están correlacionados con el error.

Pero para hacer esto, debe averiguar qué variables son exógenas para que puedan usarse para derivar los IV. Podemos notar que las variables rezagadas "ocurrieron" en el pasado y, por lo tanto, no pueden correlacionarse con el error en el presente. Las variables rezagadas son, por lo tanto, exógenas y se convierten en candidatos convenientes para derivar IV. (Sin embargo, tenga en cuenta que el argumento anterior falla cuando los errores están autocorrelacionados).

Una buena introducción y referencia a esto es la econometría introductoria: un enfoque moderno de Wooldridge.


5

Para aquellos que no están familiarizados con el siguiente fragmento de código de Stata, el OP proporcionado

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

esta ecuación se puede leer como

Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t1)

donde se estima porY~t1

Y~t1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)

(es decir, la primera etapa de la ecuación IV está dentro del paréntesis en el código Stata)

Los deltas representan diferencias de segundo, tercer y cuarto orden, y se usan como instrumentos excluidos para estimar el retraso de la variable dependiente.

En el código Stata, L.indica el retraso de esa variable por , y significa las diferencias de primer orden de esa variable, y por lo tanto significa la diferencia de segundo orden.t1D.D2.

Inicialmente, no podía pensar en ningún razonamiento lógico por el que alguien haría esto. Pero Kwak señaló (haciendo referencia a este documento ) que el método Arellano-Bond utiliza las diferencias como instrumentos para estimar el componente autorregresivo del modelo. (También inicialmente había asumido que las diferencias solo tendrían un efecto si la serie no es estacionaria, lo que Bond afirma en ese documento vinculado que las diferencias solo serán instrumentos débiles en el caso de que la serie sea una caminata aleatoria, en la página 21 )

Como sugerencias sobre material de lectura adicional como introducciones a variables instrumentales,

Otro póster en esta respuesta (Charlie) vinculado a algunas diapositivas que preparó que me gustan y sugeriría que vale la pena mirar para una introducción a las variables instrumentales. También sugeriría este powerpoint a un profesor mío preparado para un taller como introducción también. Como última sugerencia para cualquier persona interesada en aprender más sobre variables instrumentales, debe buscar el trabajo de Joshua Angrist.

Aquí está mi respuesta inicial


Si bien estoy de acuerdo con todo lo que Kwak y ars han declarado, todavía no puedo pensar en ninguna razón por la cual alguien usaría las diferencias de la variable dependiente como instrumentos para estimar el retraso de la variable dependiente (si las personas no conocen el código Stata, el L.indica retraso de esa variable por , y significa diferencias de primer orden de esa variable, y por lo tanto significa diferencias de segundo orden).t1D.D2.

En todas las aplicaciones que he visto, las personas usan el retraso de las variables independientes como instrumentos para estimar el retraso de la variable dependiente (por razones de las que habla ars). Pero esto se basa en el supuesto de que las variables independientes rezagadas son exógenas al término de error en el período de tiempo que se están aplicando.

No conozco ningún razonamiento en el que las diferencias de la variable dependiente se consideren exógenas. Hasta donde sé, no se acepta la práctica de diferenciar solo un lado de la ecuación, y produciría resultados bastante ilógicos ( aquí hay un artículo que critica a alguien sobre la situación inversa en la que incluyeron un nivel de variables como predictor de una serie diferenciada.) Si reorganiza los términos en la ecuación IV, en realidad se parece a una prueba de Dickey Fuller aumentada.

Si bien la respuesta más simple sería preguntarle a la persona que escribió el código, ¿alguien puede dar un ejemplo en el que este procedimiento sea aceptable, o cualquier situación en la que este procedimiento arroje algunos resultados significativos? Como es, no puedo pensar en ningún razonamiento lógico por el cual las diferencias tendrían un efecto en los niveles, excepto en el caso de que la serie no sea estacionaria.


Hola Andy. No sé el código stata. Es por eso que no menciono el código recortado en mi respuesta, que debe entenderse como una respuesta a la parte de la pregunta que está formulada en inglés.
usuario603

@kwak - No estaba criticando tu publicación, estoy de acuerdo con todo lo que dijiste. Simplemente me preguntaba si había alguna lógica sobre por qué alguien usaría las diferencias como instrumentos de los que no estaba al tanto. No puedo imaginar ninguna situación en la que las diferencias cumplan con alguno de los requisitos para tal procedimiento.
Andy W

Hola Andy:> No tomé tu comentario como crítico. Su publicación destaca un aspecto clave de la pregunta que ni Rob ni yo (ciertamente) entendimos. En todo caso, ilustra la importancia de la colaboración.
usuario603

+1. No vi todo esto antes. Gracias por señalar el problema, así como el curso acelerado / mini sobre notación de estado. Tomé su primer comentario para implicar que la interpretación fue errónea y respondí en un sentido muy general. Me alegra que fueras más persistente y que ese kwak lo descubriera.
ars
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.