Una buena característica de la diferencia en diferencias (DiD) es que realmente no necesita datos del panel para ello. Dado que el tratamiento ocurre en algún tipo de nivel de agregación (en las ciudades de su caso), solo necesita tomar muestras de individuos al azar de las ciudades antes y después del tratamiento. Esto le permite estimar
y obtener el efecto causal del tratamiento como la diferencia de resultado post-pre esperada para el tratado menos la diferencia de resultado post-pre esperada para el control.
yist=Ag+Bt+βDst+cXist+ϵist
Hay un caso en el que las personas usan efectos fijos individuales en lugar de un indicador de tratamiento y es cuando no tenemos un nivel de agregación bien definido en el que se produce el tratamiento. En ese caso, usted estimaría
donde es un indicador del período posterior al tratamiento para las personas que recibió el tratamiento (por ejemplo, un programa de mercado laboral que ocurre en todo el lugar). Para obtener más información sobre esto, vea estas notas de la conferencia de Steve Pischke.
yit=αi+Bt+βDit+cXit+ϵit
Dit
En su entorno, agregar efectos fijos individuales no debería cambiar nada con respecto a las estimaciones puntuales. El indicador de tratamiento solo será absorbido por los efectos fijos individuales. Sin embargo, estos efectos fijos pueden absorber parte de la varianza residual y, por lo tanto, reducir potencialmente el error estándar de su coeficiente DiD.Ag
Aquí hay un ejemplo de código que muestra que este es el caso. Yo uso Stata pero puedes replicar esto en el paquete estadístico que elijas. Los "individuos" aquí son en realidad países, pero todavía están agrupados de acuerdo con algún indicador de tratamiento.
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
Entonces, verá que el coeficiente DiD permanece igual cuando se incluyen los efectos fijos individuales ( areg
es uno de los comandos de estimación de efectos fijos disponibles en Stata). Los errores estándar son ligeramente más estrictos y nuestro indicador de tratamiento original fue absorbido por los efectos fijos individuales y, por lo tanto, disminuyó en la regresión.
En respuesta al comentario
, mencioné el ejemplo de Pischke para mostrar cuándo las personas usan efectos fijos individuales en lugar de un indicador de grupo de tratamiento. Su configuración tiene una estructura de grupo bien definida, por lo que la forma en que ha escrito su modelo está perfectamente bien. Los errores estándar deben agruparse a nivel de ciudad, es decir, el nivel de agregación en el que se produce el tratamiento (no lo he hecho en el código de ejemplo, pero en la configuración de DiD los errores estándar deben corregirse como lo demuestra el artículo de Bertrand et al. )
En cuanto a los motores, no tienen mucho que jugar aquí. El indicador de tratamiento es igual a 1 para las personas que viven en una ciudad tratada en el período posterior al tratamiento . Para calcular el coeficiente DiD, en realidad solo necesitamos calcular cuatro expectativas condicionales, a saber,
Dstst
c=[E(yist|s=1,t=1)−E(yist|s=1,t=0)]−[E(yist|s=0,t=1)−E(yist|s=0,t=0)]
Entonces, si tiene 4 períodos de postratamiento para una persona que vive en una ciudad tratada durante los primeros dos, y luego se muda a una ciudad de control durante los dos períodos restantes, las primeras dos de esas observaciones se usarán en el cálculo de y los dos últimos en . Para aclarar por qué la identificación proviene de las diferencias de grupo a lo largo del tiempo y no de los motores, puede visualizar esto con un gráfico simple. Suponga que el cambio en el resultado es realmente solo por el tratamiento y que tiene un efecto contemporáneo. Si tenemos un individuo que vive en una ciudad tratada después de que comienza el tratamiento pero luego se muda a una ciudad de control, su resultado debería volver a ser lo que era antes de que fueran tratados. Esto se muestra en el gráfico estilizado a continuación.E ( y i s t | s = 0 , t = 1 )E(yist|s=1,t=1)E(yist|s=0,t=1)
Sin embargo, es posible que aún desee pensar en los motores por otras razones. Por ejemplo, si el tratamiento tiene un efecto duradero (es decir, aún afecta el resultado aunque el individuo se haya movido)