Solía pensar que el "modelo de efectos aleatorios" en econometría corresponde a un "modelo mixto con intercepción aleatoria" fuera de la econometría, pero ahora no estoy seguro. ¿Lo hace?
Econometría utiliza términos como "efectos fijos" y "efectos aleatorios" de forma algo diferente de la literatura sobre modelos mixtos, y esto causa una notoria confusión. Consideremos una situación simple donde depende linealmente de pero con una intercepción diferente en diferentes grupos de medidas:
Aquí cada unidad / grupo se observa en diferentes puntos de tiempo . Los econométricos lo llaman "datos del panel".
En la terminología de modelos mixtos, podemos tratar como un efecto fijo o como un efecto aleatorio (en este caso, es una intercepción aleatoria). Tratándolo como medios fijos ajustados β y u i para minimizar el error al cuadrado (es decir, se ejecuta OLS de regresión con variables de grupo ficticio). Tratarlo como aleatorio significa que adicionalmente asumimos que u i ∼ N ( u 0 , σ 2 u ) y usamos la máxima probabilidad de ajustar u 0 y σ 2 u en lugar de ajustar cada u ipor sí mismo. Esto nos lleva al efecto de "agrupación parcial", donde las estimaciones u i obtener encogido hacia su media u 0 .
R formula when treating group as fixed: y ~ x + group R formula when treating group as random: y ~ x + (1|group)
- En terminología econométrica, podemos tratar todo este modelo como un modelo de efectos fijos o como un modelo de efectos aleatorios. La primera opción es equivalente al efecto fijo anterior (pero la econometría tiene su propia forma de estimar en este caso, llamada
"within" estimator
). Solía pensar que la segunda opción es equivalente al efecto aleatorio anterior; Por ejemplo, @JiebiaoWang en su respuesta altamente votada a ¿Cuál es la diferencia entre los efectos aleatorios, los efectos fijos y el modelo marginal? dice queEn econometría, el modelo de efectos aleatorios solo puede referirse al modelo de intercepción aleatoria como en bioestadística
De acuerdo --- demostremos si esta comprensión es correcta. Aquí hay algunos datos aleatorios generados por @ChristophHanck en su respuesta a ¿Cuál es la diferencia entre los modelos de efectos fijos, de efectos aleatorios y de efectos mixtos? (Pongo los datos aquí en pastebin para aquellos que no usan R):
@ Christoph hace dos ajustes usando enfoques econométricos:
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")
El primero produce la estimación de beta igual a -1.0451
, el segundo 0.77031
(sí, ¡positivo!). Traté de reproducirlo con lm
y lmer
:
l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)
El primero rinde -1.045
en perfecto acuerdo con el estimador interno anterior. Bueno. Pero el segundo produce -1.026
, que está a millas de distancia del estimador de efectos aleatorios. Je Que esta pasando? De hecho, lo que está plm
incluso haciendo , cuando se le llama conmodel = "random"
?
Lo que sea que esté haciendo, ¿se puede entender de alguna manera a través de la perspectiva de modelos mixtos?
¿Y cuál es la intuición detrás de lo que sea que esté haciendo? Leí en un par de lugares econométricos que el estimador de efectos aleatorios es un promedio ponderado entre el estimador de efectos fijos y el "between" estimator
cual es más o menos pendiente de regresión si no incluimos la identidad de grupo en el modelo (esta estimación es muy positiva en este caso, alrededor 4
.) Por ejemplo, @Andy escribe aquí :
El estimador de efectos aleatorios luego usa un promedio ponderado de matriz de la variación interna y entre sus datos. [...] Esto hace que los efectos aleatorios sean más eficientes [.]
¿Por qué? ¿Por qué querríamos este promedio ponderado? Y en particular, ¿por qué lo querríamos en lugar de ejecutar un modelo mixto?