Para aquellos que no están familiarizados con el siguiente fragmento de código de Stata, el OP proporcionado
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
esta ecuación se puede leer como
Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t−1)
donde se estima porY~t−1
Y~t−1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)
(es decir, la primera etapa de la ecuación IV está dentro del paréntesis en el código Stata)
Los deltas representan diferencias de segundo, tercer y cuarto orden, y se usan como instrumentos excluidos para estimar el retraso de la variable dependiente.
En el código Stata, L.
indica el retraso de esa variable por , y significa las diferencias de primer orden de esa variable, y por lo tanto significa la diferencia de segundo orden.t−1D.
D2.
Inicialmente, no podía pensar en ningún razonamiento lógico por el que alguien haría esto. Pero Kwak señaló (haciendo referencia a este documento ) que el método Arellano-Bond utiliza las diferencias como instrumentos para estimar el componente autorregresivo del modelo. (También inicialmente había asumido que las diferencias solo tendrían un efecto si la serie no es estacionaria, lo que Bond afirma en ese documento vinculado que las diferencias solo serán instrumentos débiles en el caso de que la serie sea una caminata aleatoria, en la página 21 )
Como sugerencias sobre material de lectura adicional como introducciones a variables instrumentales,
Otro póster en esta respuesta (Charlie) vinculado a algunas diapositivas que preparó que me gustan y sugeriría que vale la pena mirar para una introducción a las variables instrumentales. También sugeriría este powerpoint a un profesor mío preparado para un taller como introducción también. Como última sugerencia para cualquier persona interesada en aprender más sobre variables instrumentales, debe buscar el trabajo de Joshua Angrist.
Aquí está mi respuesta inicial
Si bien estoy de acuerdo con todo lo que Kwak y ars han declarado, todavía no puedo pensar en ninguna razón por la cual alguien usaría las diferencias de la variable dependiente como instrumentos para estimar el retraso de la variable dependiente (si las personas no conocen el código Stata, el L.
indica retraso de esa variable por , y significa diferencias de primer orden de esa variable, y por lo tanto significa diferencias de segundo orden).t−1D.
D2.
En todas las aplicaciones que he visto, las personas usan el retraso de las variables independientes como instrumentos para estimar el retraso de la variable dependiente (por razones de las que habla ars). Pero esto se basa en el supuesto de que las variables independientes rezagadas son exógenas al término de error en el período de tiempo que se están aplicando.
No conozco ningún razonamiento en el que las diferencias de la variable dependiente se consideren exógenas. Hasta donde sé, no se acepta la práctica de diferenciar solo un lado de la ecuación, y produciría resultados bastante ilógicos ( aquí hay un artículo que critica a alguien sobre la situación inversa en la que incluyeron un nivel de variables como predictor de una serie diferenciada.) Si reorganiza los términos en la ecuación IV, en realidad se parece a una prueba de Dickey Fuller aumentada.
Si bien la respuesta más simple sería preguntarle a la persona que escribió el código, ¿alguien puede dar un ejemplo en el que este procedimiento sea aceptable, o cualquier situación en la que este procedimiento arroje algunos resultados significativos? Como es, no puedo pensar en ningún razonamiento lógico por el cual las diferencias tendrían un efecto en los niveles, excepto en el caso de que la serie no sea estacionaria.