Una suposición clave de la diferencia en diferencias (DID) es que ambos grupos tienen una tendencia común en la variable de resultado antes del tratamiento. Esto es importante para argumentar que el cambio para el grupo tratado se debe al tratamiento y no porque los dos grupos ya eran diferentes entre sí para empezar.
Si toma muestras de diferentes personas antes y después del tratamiento, esto debilitará el argumento a menos que sus muestras de los grupos de tratamiento y control sean realmente aleatorias y grandes. Por lo tanto, puede suceder que alguien le pregunte: "¿Cómo puede asegurarse de que el efecto se deba al tratamiento y no solo a una muestra de diferentes personas?" - Y eso será difícil de responder. Puede evitar esta pregunta utilizando los datos del panel porque allí realiza un seguimiento de las mismas unidades estadísticas a lo largo del tiempo y, en general, este es el enfoque más sólido.
Para responder a su última pregunta: sí, los datos son importantes, pero seguramente puede usar OLS para estimar su ecuación anterior. Una cosa importante que en el pasado a menudo se pasaba por alto es la estimación correcta de los errores estándar. Si no los corrige, la correlación en serie los subestimará en una buena cantidad y encontrará efectos significativos, aunque probablemente no debería hacerlo. Como referencia y sugerencias sobre cómo abordar este problema, ver Bertrand et al. (2004) "¿Cuánto debemos confiar en las estimaciones de diferencias en diferencias?" .
Como último aspecto, si tiene datos agregados (por ejemplo, a nivel estatal) o si puede agregar fácilmente los suyos y si desea utilizar un método econométrico más reciente que el DID, es posible que desee echar un vistazo a Abadie et al. (2010) "Métodos de control sintéticos para estudios de casos comparativos" . El método de control sintético se usa cada vez más en la investigación actual y existen rutinas bien documentadas para R y Stata. Quizás esto también sea algo interesante para ti.