¿Cómo se relaciona exactamente un "modelo de efectos aleatorios" en econometría con modelos mixtos fuera de la econometría?


56

Solía ​​pensar que el "modelo de efectos aleatorios" en econometría corresponde a un "modelo mixto con intercepción aleatoria" fuera de la econometría, pero ahora no estoy seguro. ¿Lo hace?

Econometría utiliza términos como "efectos fijos" y "efectos aleatorios" de forma algo diferente de la literatura sobre modelos mixtos, y esto causa una notoria confusión. Consideremos una situación simple donde y depende linealmente de x pero con una intercepción diferente en diferentes grupos de medidas:

yit=βxit+ui+ϵit.

Aquí cada unidad / grupo i se observa en diferentes puntos de tiempo t . Los econométricos lo llaman "datos del panel".

  • En la terminología de modelos mixtos, podemos tratar ui como un efecto fijo o como un efecto aleatorio (en este caso, es una intercepción aleatoria). Tratándolo como medios fijos ajustados β y u i para minimizar el error al cuadrado (es decir, se ejecuta OLS de regresión con variables de grupo ficticio). Tratarlo como aleatorio significa que adicionalmente asumimos que u iN ( u 0 , σ 2 u ) y usamos la máxima probabilidad de ajustar u 0 y σ 2 u en lugar de ajustar cada u iβ^u^iuiN(u0,σu2)u0σu2uipor sí mismo. Esto nos lleva al efecto de "agrupación parcial", donde las estimaciones u i obtener encogido hacia su media u 0 .u^iu^0

    R formula when treating group as fixed:    y ~ x + group
    R formula when treating group as random:   y ~ x + (1|group)
  • En terminología econométrica, podemos tratar todo este modelo como un modelo de efectos fijos o como un modelo de efectos aleatorios. La primera opción es equivalente al efecto fijo anterior (pero la econometría tiene su propia forma de estimar β en este caso, llamada "within" estimator). Solía ​​pensar que la segunda opción es equivalente al efecto aleatorio anterior; Por ejemplo, @JiebiaoWang en su respuesta altamente votada a ¿Cuál es la diferencia entre los efectos aleatorios, los efectos fijos y el modelo marginal? dice que

    En econometría, el modelo de efectos aleatorios solo puede referirse al modelo de intercepción aleatoria como en bioestadística

De acuerdo --- demostremos si esta comprensión es correcta. Aquí hay algunos datos aleatorios generados por @ChristophHanck en su respuesta a ¿Cuál es la diferencia entre los modelos de efectos fijos, de efectos aleatorios y de efectos mixtos? (Pongo los datos aquí en pastebin para aquellos que no usan R):

ingrese la descripción de la imagen aquí

@ Christoph hace dos ajustes usando enfoques econométricos:

fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

El primero produce la estimación de beta igual a -1.0451, el segundo 0.77031(sí, ¡positivo!). Traté de reproducirlo con lmy lmer:

l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)

El primero rinde -1.045en perfecto acuerdo con el estimador interno anterior. Bueno. Pero el segundo produce -1.026, que está a millas de distancia del estimador de efectos aleatorios. Je Que esta pasando? De hecho, lo que está plmincluso haciendo , cuando se le llama conmodel = "random" ?

Lo que sea que esté haciendo, ¿se puede entender de alguna manera a través de la perspectiva de modelos mixtos?

¿Y cuál es la intuición detrás de lo que sea que esté haciendo? Leí en un par de lugares econométricos que el estimador de efectos aleatorios es un promedio ponderado entre el estimador de efectos fijos y el "between" estimatorcual es más o menos pendiente de regresión si no incluimos la identidad de grupo en el modelo (esta estimación es muy positiva en este caso, alrededor 4.) Por ejemplo, @Andy escribe aquí :

El estimador de efectos aleatorios luego usa un promedio ponderado de matriz de la variación interna y entre sus datos. [...] Esto hace que los efectos aleatorios sean más eficientes [.]

¿Por qué? ¿Por qué querríamos este promedio ponderado? Y en particular, ¿por qué lo querríamos en lugar de ejecutar un modelo mixto?


8
Wow, más de 20 votos a favor y seis respuestas esclarecedoras en menos de 24 horas, pero todos se centran en el lado econométrico de los pensamientos. Ninguna respuesta hace una conexión con modelos mixtos hasta ahora.
ameba dice Reinstate Monica


Respuestas:


16

Resumen: el "modelo de efectos aleatorios" en econometría y un "modelo mixto de intercepción aleatoria" son de hecho los mismos modelos, pero se estiman de diferentes maneras. La forma econométrica es usar FGLS, y la forma de modelo mixto es usar ML. Existen diferentes algoritmos para hacer FGLS, y algunos de ellos (en este conjunto de datos) producen resultados que están muy cerca de ML.


1. Diferencias entre los métodos de estimación en plm

Contestaré con mis pruebas plm(..., model = "random")y lmer(), utilizando los datos generados por @ChristophHanck.

De acuerdo con el manual del paquete plm , existen cuatro opciones para random.method: el método de estimación de los componentes de la varianza en el modelo de efectos aleatorios. @amoeba usó el predeterminado swar(Swamy y Arora, 1972).

Para los modelos de efectos aleatorios, cuatro estimadores del parámetro de transformación están disponibles al establecer random.method en uno de "swar" (Swamy y Arora (1972)) (predeterminado), "amemiya" (Amemiya (1971)), "walhus" ( Wallace y Hussain (1969)), o "nerlove" (Nerlove (1971)).

Probé las cuatro opciones usando los mismos datos, obteniendo un erroramemiya y tres estimaciones de coeficientes totalmente diferentes para la variable stackX. Los que usan random.method='nerlove'y 'amemiya' son casi equivalentes a los de lmer()-1.029 y -1.025 vs -1.026. Tampoco son muy diferentes de los obtenidos en el modelo de "efectos fijos", -1.045.

# "amemiya" only works using the most recent version:
# install.packages("plm", repos="http://R-Forge.R-project.org")

re0 <- plm(stackY~stackX, data = paneldata, model = "random") #random.method='swar'
re1 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='amemiya')
re2 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='walhus')
re3 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='nerlove')
l2  <- lmer(stackY~stackX+(1|as.factor(unit)), data = paneldata)

coef(re0)     #    (Intercept)   stackX    18.3458553   0.7703073 
coef(re1)     #    (Intercept)   stackX    30.217721   -1.025186 
coef(re2)     #    (Intercept)   stackX    -1.15584     3.71973 
coef(re3)     #    (Intercept)   stackX    30.243678   -1.029111 
fixef(l2)     #    (Intercept)   stackX    30.226295   -1.026482 

Lamentablemente, no tengo tiempo en este momento, pero los lectores interesados ​​pueden encontrar las cuatro referencias para verificar sus procedimientos de estimación. Sería muy útil descubrir por qué hacen tanta diferencia. Espero que, en algunos casos, el plmprocedimiento de estimación que utiliza los lm()datos transformados sea equivalente al procedimiento de máxima verosimilitud utilizado en lmer().

2. Comparación entre GLS y ML

Los autores del plmpaquete compararon los dos en la Sección 7 de su artículo: Yves Croissant y Giovanni Millo, 2008, Panel Data Econometrics in R: The plm package .

La econometría se ocupa principalmente de datos no experimentales. Se pone gran énfasis en los procedimientos de especificación y las pruebas de especificación errónea. Por lo tanto, las especificaciones del modelo tienden a ser muy simples, mientras que se presta gran atención a los problemas de endogeneidad de los regresores, las estructuras de dependencia en los errores y la robustez de los estimadores bajo desviaciones de la normalidad. El enfoque preferido es a menudo semi o no paramétrico, y las técnicas consistentes con heterocedasticidad se están convirtiendo en una práctica estándar tanto en la estimación como en las pruebas.

Por todas estas razones, la [...] estimación del modelo de panel en econometría se realiza principalmente en el marco generalizado de mínimos cuadrados basado en el Teorema [...] de Aitken. Por el contrario, los modelos de datos longitudinales en nlmeylme4 se estiman por la probabilidad máxima (restringida o no restringida). [...]

El enfoque econométrico de GLS tiene soluciones analíticas de forma cerrada computables por álgebra lineal estándar y, aunque este último a veces puede ser computacionalmente pesado en la máquina, las expresiones para los estimadores suelen ser bastante simples. La estimación de ML de modelos longitudinales, por el contrario, se basa en la optimización numérica de funciones no lineales sin soluciones de forma cerrada y, por lo tanto, depende de aproximaciones y criterios de convergencia.


3. Actualización sobre modelos mixtos

Aprecio que @ChristophHanck proporcionó una introducción exhaustiva sobre los cuatro random.methodutilizados enplm y explicó por qué sus estimaciones son tan diferentes. Según lo solicitado por @amoeba, agregaré algunas ideas sobre los modelos mixtos (basados ​​en la probabilidad) y su conexión con GLS.

El método basado en la probabilidad generalmente supone una distribución tanto para el efecto aleatorio como para el término de error. Se suele utilizar un supuesto de distribución normal, pero también hay algunos estudios que suponen una distribución no normal. Seguiré las notaciones de @ ChristophHanck para un modelo de intercepción aleatoria y permitiré datos no balanceados, es decir, sea .T=ni

El modelo es con η iN ( 0 , σ 2 η ) , ϵ i tN ( 0 , σ 2 ϵ ) .

yyot=Xyotβ+ηyo+ϵyotyo=1,...,metro,t=1,...,norteyo
ηiN(0,ση2),ϵitN(0,σϵ2)

Para cada , y iN ( X i β , Σ i ) ,i Entonces la función log-verosimilitud esconst-1

yiN(Xiβ,Σi),Σi=ση21ni1ni+σϵ2Ini.
const12ilog|Σi|12i(yiXiβ)Σi1(yiXiβ).

Cuando se conocen todas las variaciones, como se muestra en Laird y Ware (1982), el MLE es β = ( Σ i X que es equivalente a los GLSbetaREderivado por @ChristophHanck. Entonces, la diferencia clave está en la estimación de las variaciones. Dado que no existe una solución de forma cerrada, existen varios enfoques:

β^=(iXiΣi1Xi)1(iXiΣi1yi),
β^RE
  • maximización directa de la función log-verosimilitud utilizando algoritmos de optimización;
  • Algoritmo de maximización de expectativas (EM): existen soluciones de forma cerrada, pero el estimador para involucra estimaciones bayesianas empíricas de la intercepción aleatoria;β
  • una combinación de los dos anteriores, el algoritmo Expectation / Maximization Conditional Either (ECME) (Schafer, 1998; paquete R lmm). Con una parametrización diferente, existen soluciones de forma cerrada para (como arriba) y σ 2 ϵ . La solución para σ 2 ϵ se puede escribir como σ 2 ϵ = 1βσϵ2σϵ2dondeξse define comoσ2η/σ2εy se puede estimar en un marco EM.
    σϵ2=1inii(yiXiβ^)(ξ^1ni1ni+Ini)1(yiXiβ^),
    ξση2/σϵ2

En resumen, MLE tiene supuestos de distribución, y se estima en un algoritmo iterativo. La diferencia clave entre MLE y GLS está en la estimación de las variaciones.

Croissant y Millo (2008) señalaron que

Si bien bajo normalidad, la homoscedasticidad y la ausencia de correlación serial de los errores OLS también son el estimador de máxima probabilidad, en todos los demás casos existen diferencias importantes.

En mi opinión, para el supuesto de distribución, al igual que la diferencia entre los enfoques paramétricos y no paramétricos, MLE sería más eficiente cuando se cumple el supuesto, mientras que GLS sería más robusto.


Sospecho que el problema con el mensaje de error está relacionado de alguna manera conmigo generando las variables como vectores. ¿Quizás plm prefiere que los datos se almacenen de manera diferente?
Christoph Hanck

1
nerlovefunciona bien aquí, pero no se implementa para paneles desequilibrados, como descubrí al eliminar 1 observación del último panel e intentar ejecutar todos los métodos.
ameba dice Reinstate Monica

2
@ChristophHanck @amoeba Se me ocurre el plmerror random.method="amemiya"que probablemente deberían usar en X[, -1, drop=FALSE]lugar de X[, -1]conservar el formato de matriz de X[, -1]cuando solo hay una covariable en el modelo. De todos modos, traté de superar esto agregando una variable normal estándar a la fórmula. amemiyareproduce el resultado con una estimación de -1.02 y también funciona para datos no balanceados.
Randel

3
@ jiebiao-wang @ChristophHanck @amoeba la versión de desarrollo actual de plm funciona bien con random.method="amemiya": var std.dev share idiosyncratic 0.6360 0.7975 0.002 individual 313.6510 17.7102 0.998 theta: 0.9841
Helix123

1
Hola @JiebiaoWang. Pensé que después de su actualización, su respuesta responde a mi pregunta satisfactoriamente. Me tomé la libertad de hacer algunas ediciones e insertar una actualización amemiyay una cita sobre ML vs GLS. Lo estoy marcando como aceptado y le otorgaré una recompensa. Salud.
ameba dice Reinstate Monica

17

Esta respuesta no comenta sobre modelos mixtos, pero puedo explicar qué hace el estimador de efectos aleatorios y por qué se arruina en ese gráfico.

E[uyoX]=0 0


¿Qué está haciendo el estimador de efectos aleatorios?

Supongamos que tenemos el modelo:

yyot=βXyot+tuyo+ϵyot

yotβ

  1. Solo use la variación de series de tiempo dentro de un grupo. Esto es lo que hace el estimador de efectos fijos (y es por eso que a menudo también se le llama estimador interno).
  2. tuyo

    yo

    y¯yo=βX¯yo+vyo dónde vyo=tuyo+ϵ¯yo

    tuyoX

β^

¿Qué está pasando en ese gráfico ...

Simplemente mirando ese gráfico, puede ver claramente lo que está sucediendo:

  • yoXyotyyot
  • yoX¯yotuyo

mi[tuyoX]=0 0tuyoXX

mi[tuyoX]=0 0mi[tuyoX]=0 0β^

Luego, a su vez, el estimador de efectos aleatorios está apagado porque es un promedio ponderado del estimador interno y el estimador intermedio.


+1, gracias Matthew. No estoy seguro de por qué alguien rechazó su respuesta. Estoy buscando una respuesta que establezca la conexión con modelos mixtos, por lo que no aceptaré la suya, pero aún me resulta útil para esta discusión. Si puede ampliar un poco cómo se aplican y calculan aquí las ponderaciones de GLS y de varianza inversa, sería muy útil.
ameba dice Reinstate Monica

16

En esta respuesta, me gustaría elaborar un poco sobre la respuesta de Matthew +1 con respecto a la perspectiva GLS sobre lo que la literatura de econometría llama el estimador de efectos aleatorios.

Perspectiva GLS

yit=α+Xitβ+uiti=1,,m,t=1,,T
E(uit|Xit)=0 0n=mT

tuyot

tuyot=ηyo+ϵyot

y=αιmetroT+Xβ+reη+ϵ
yϵnorteyyotϵyotrenorte×metroreyoreyoyo=1,...,metro

mi(ϵϵ)=σϵ2yo

ηϵyot

mi(ηyoEl |X)=0 0
ηyoση2

Var(tuyot)=ση2+σϵ2Cov(tuyot,tuyos)=ση2Cov(tuyot,tujs)=0 0para todos yoj

norte×norteΩ

Ω=(ΣOOOΣOOOΣ)
Σ=ση2ιι+σϵ2yoT
ιT
Ω=ση2(yometroιι)+σϵ2(yometroyoT)
β^Rmi=(XΩ-1X)-1XΩ-1y
Ω-1JT=ιιJ¯T=JT/ /TmiT=yoT-J¯T
Ω=Tση2(yometroJ¯T)+σϵ2(yometromiT)+σϵ2(yometroJ¯T)
Ω=(Tση2+σϵ2)(yometroJ¯T)+σϵ2(yometromiT)
PAGS=yometroJ¯TQ=yometromiT
Ω-1=1σ12PAGS+1σϵ2Q=-ση2σ12σϵ2(yometroιι)+1σϵ2(yometroyoT),
σ12=Tση2+σϵ2

ηyo

(yyot-θy¯yo)=(Xyot-θX¯yo)β+(tuyot-θtuyo),
θ=1-ση/ /σ1θ=1θ-θ=0 0

GLS factibles

σ12σϵ2

tuyot

σ^12=T1metroyo=1metrotu¯yo2
σ^ϵ2=1metro(T-1)yo=1metrot=1T(tuyot-1metroyo=1metrotu¯yo)2
tu¯yoyo

tu

yoηyo=0 0α^=y¯-X¯β^Fmiyottu^=y-α^-Xβ^Fmi

σ^ϵ2=[yQ(yo-X(XQX)-1XQ)y]/ /[metro(T-1)-K]
σ^12=[yPAGS(yo-Z(ZPAGSX)-1ZPAGS)y]/ /[metro-K-1]
Z=(ιmetroTX)

ση2yo=1metro(η^yo-η^¯)2/ /(metro-1)η^yoσ^ϵ2metroT en el denominador

¡También estoy muy sorprendido de que estos hagan una gran diferencia como lo demuestran los cálculos de Randel!

EDITAR:

Con respecto a las diferencias, las estimaciones de los componentes del error pueden recuperarse en el plmpaquete y, de hecho, arrojar resultados muy diferentes, explicando la diferencia en las estimaciones puntuales paraβ(según la respuesta de @ Randel, amemiyaarroja un error que no intenté solucionar):

> ercomp(stackY~stackX, data = paneldata, method = "walhus")
                  var std.dev share
idiosyncratic 21.0726  4.5905 0.981
individual     0.4071  0.6380 0.019
theta:  0.06933  
> ercomp(stackY~stackX, data = paneldata, method = "swar")
                 var std.dev share
idiosyncratic 0.6437  0.8023 0.229
individual    2.1732  1.4742 0.771
theta:  0.811  
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
                   var  std.dev share
idiosyncratic   0.5565   0.7460 0.002
individual    342.2514  18.5000 0.998
theta:  0.9857  

Sospecho que los estimadores de los componentes del error tampoco son consistentes en mi ejemplo en el hilo hermano donde pretendo demostrar diferencias entre FE y RE utilizando datos donde los efectos individuales yXestán correlacionados (De hecho, no pueden serlo, porque en última instancia alejan la estimación RE de la estimación FE según el hecho de que RE es un promedio ponderado de FE y entre la estimación con pesos determinados por las estimaciones del componente de error. Entonces, si RE no es consistente, que en última instancia se debe a estas estimaciones.)

Si reemplaza la función "ofensiva" de ese ejemplo,

alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))

simplemente, digamos,

alpha = runif(n)

por lo que los efectos aleatorios que no están correlacionados con X, obtienes estimaciones de puntos RE para β muy cerca del verdadero valor β=-1 para todas las variantes de estimar los componentes del error.


Referencias

Amemiya, T., 1971, La estimación de las varianzas en un modelo de componentes de varianza , International Economic Review 12, 1-13.

Baltagi, BH, Análisis econométrico de datos de panel, Wiley.

Nerlove, M., 1971a, Evidencia adicional sobre la estimación de las relaciones económicas dinámicas a partir de una serie temporal de secciones transversales , Econometrica 39, 359-382.

Swamy, PAVB y SS Arora, 1972, Las propiedades exactas de la muestra finita de los estimadores de coeficientes en los modelos de regresión de componentes de error , Econometrica 40, 261–275.

Wallace, TD y A. Hussain, 1969, El uso de modelos de componentes de error en la combinación de datos de secciones transversales y series temporales , Econometrica 37, 55–72.


44
+1. Gracias Christoph, esto es útil y estoy feliz de ver finalmente algunos detalles matemáticos en este hilo. Sería genial ver cómo funcionan los cuatro métodos implementados plmy enumerados por Randel y actualizar su respuesta con algunos comentarios al respecto. Si no son las descripciones detalladas, al menos algunas notas breves sobre lo que está sucediendo. ¿Crees que podrías buscarlo? Estoy feliz de ofrecer una recompensa por eso :-) Mi enfoque ingenuo sería estimar ambos sigmas de la solución de efectos fijos. ¿Corresponde a uno de los métodos "nombrados"?
ameba dice Reinstate Monica

@amoeba, incluí algunos comentarios sobre cómo estimar las variaciones en el modelo de componente de error. Su sugerencia parece estar estrechamente relacionada con la de Amemiya.
Christoph Hanck

Muy bien, gracias. ¿No está Nerlove también usando regresión con maniquíes? De hecho, no entiendo cuál es la diferencia entre Amemiya y Nerlove. Mi sugerencia "ingenua" era ajustar la regresión ficticia, usar la varianza residual como una estimación deσϵ y usar la varianza de los coeficientes ficticios como una estimación de ση. Parece que eso es lo que está haciendo Nerlove. No estoy seguro de entender lo que Amemiya está haciendo y cómo es diferente. (Y estoy de acuerdo en que sigue habiendo una gran pregunta sobre por qué estos métodos producen tanta diferencia en este caso).
ameba dice Reinstate Monica

Sí, ambos usan regresión con dummies. Según tengo entendido, una diferencia entre Amemiya y Nerlove es el denominador para los grados de corrección de libertad. Otra es que no estoy seguro de que la varianza de los coeficientes ficticios estimados sea la misma que la varianza de los residuos. Otra crucial es que Nerlove apunta directamente a estimarση2, mientras que tendría que retroceder la estimación a través de (σ^12-σ^ϵ2)/ /T para los otros tres, y una desventaja conocida de estos es que no hay garantía de que estos no sean negativos.
Christoph Hanck

1
Gracias. Hice una edición para proporcionar una fórmula más explícita paraΩ-1, es posible que desee verificar dos veces (pero creo que es correcto). Comencé una recompensa que voy a otorgar a tu respuesta. Sin embargo, todavía estoy buscando una respuesta que establezca una conexión con modelos mixtos, contraste GLS a MLE, y explique por qué y cuándo uno debería preferir qué enfoque (ninguna de las respuestas actuales lo hace, por lo que actualmente no hay una respuesta que quisiera marque como "aceptado"). Es interesante que MLE (según lo implementado lmer) arroja estimaciones de varianza muy cercanas a las de Nerlove.
ameba dice Reinstate Monica

11

Realmente no estoy lo suficientemente familiarizado con R para comentar su código, pero el modelo mixto de interceptación aleatoria simple debe ser idéntico al estimador RE MLE y muy cercano al estimador RE GLS, excepto cuando es total norte=yoTyoes pequeño y los datos no están equilibrados. Con suerte, esto será útil para diagnosticar el problema. Por supuesto, todo esto supone que el estimador RE es apropiado.

Aquí hay algunos Stata que muestran la equivalencia (requiere esttaby eststode SSC):

set more off
estimates clear
webuse nlswork, clear
eststo, title(mixed): mixed ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure || id: // Mixed estimator
eststo, title(MLE): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) mle // MLE RE estimator 
eststo, title(GLS): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) re // GLS RE estimato
esttab *, b(a5) se(a5) mtitle 

Aquí está la salida de la última línea:

. esttab *, b(a5) se(a5) mtitle 

------------------------------------------------------------
                      (1)             (2)             (3)   
                    mixed             MLE             GLS   
------------------------------------------------------------
main                                                        
grade            0.070790***     0.070790***     0.070760***
              (0.0017957)     (0.0017957)     (0.0018336)   

age              0.031844***     0.031844***     0.031906***
              (0.0027201)     (0.0027202)     (0.0027146)   

c.age#c.age   -0.00065130***  -0.00065130***  -0.00065295***
             (0.000044965)    (0.000044971)    (0.000044880)   

ttl_exp          0.035228***     0.035228***     0.035334***
              (0.0011382)     (0.0011392)     (0.0011446)   

tenure           0.037134***     0.037134***     0.037019***
              (0.0015715)     (0.0015723)     (0.0015681)   

c.tenure#c~e   -0.0018382***   -0.0018382***   -0.0018387***
             (0.00010128)    (0.00010128)    (0.00010108)   

_cons             0.14721***      0.14721***      0.14691** 
               (0.044725)      (0.044725)      (0.044928)   
------------------------------------------------------------
lns1_1_1                                                    
_cons            -1.31847***                                
               (0.013546)                                   
------------------------------------------------------------
lnsig_e                                                     
_cons            -1.23024***                                
              (0.0046256)                                   
------------------------------------------------------------
sigma_u                                                     
_cons                             0.26754***                
                              (0.0036240)                   
------------------------------------------------------------
sigma_e                                                     
_cons                             0.29222***                
                              (0.0013517)                   
------------------------------------------------------------
N                   28099           28099           28099   
------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

En sus datos, las suposiciones para usar el estimador RE no se cumplen, ya que el efecto del grupo está claramente correlacionado con x, por lo que obtiene estimaciones muy diferentes. El estimador GLS RE en realidad es un estimador de método generalizado de momentos (GMM) que es un promedio ponderado por matriz de los estimadores entre y dentro de ellos. El estimador interno va a estar bien aquí, pero el intermedio se va a atornillar profundamente, mostrando grandes efectos positivos de X. Por lo tanto, GLS será principalmente el estimador intermedio. El MLE RE es un MLE que maximiza la probabilidad del modelo de efectos aleatorios. Ya no se espera que produzcan la misma respuesta. Aquí el estimador mixto está dando algo muy cercano al estimador FE "Dentro":

. esttab *, b(a5) se(a5) mtitle 

----------------------------------------------------------------------------
                      (1)             (2)             (3)             (4)   
                    mixed             GLS             MLE          Within   
----------------------------------------------------------------------------
main                                                                        
x                -1.02502***      0.77031**       3.37983***     -1.04507***
               (0.092425)       (0.26346)       (0.20635)      (0.093136)   

_cons             30.2166***      18.3459***      0.49507         30.3492***
                (5.12978)       (2.31566)             (.)       (0.62124)   
----------------------------------------------------------------------------
lns1_1_1                                                                    
_cons             2.87024***                                                
                (0.20498)                                                   
----------------------------------------------------------------------------
lnsig_e                                                                     
_cons            -0.22598**                                                 
               (0.077195)                                                   
----------------------------------------------------------------------------
sigma_u                                                                     
_cons                                             2.40363                   
                                                (1.28929)                   
----------------------------------------------------------------------------
sigma_e                                                                     
_cons                                             4.23472***                
                                                (0.37819)                   
----------------------------------------------------------------------------
N                      96              96              96              96   
----------------------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Aquí está el código Stata para la tabla anterior:

clear
set more off
estimates clear

input int(obs id t) double(y x)
1      1           1  2.669271  0.5866982
2      1           2  1.475540  1.3500454
3      1           3  4.430008  0.6830919
4      1           4  2.162789  0.5845966
5      1           5  2.678108  1.0038879
6      1           6  3.456636  0.5863289
7      1           7  1.769204  2.3375403
8      1           8  3.413790  0.9640034
9      2           1  4.017493  1.5084121
10     2           2  4.218733  2.8982499
11     2           3  4.509530  3.2141335
12     2           4  6.106228  2.0317799
13     2           5  5.161379  2.1231733
14     2           6  2.724643  4.3369017
15     2           7  4.500306  1.9141065
16     2           8  4.119322  2.8667938
17     3           1  9.987779  2.3961969
18     3           2  7.768579  3.5509275
19     3           3  9.379788  3.3284869
20     3           4 10.035937  2.2997389
21     3           5 11.752360  2.8143474
22     3           6  9.500264  2.1825704
23     3           7  8.921687  5.0126462
24     3           8  8.269932  3.4046339
25     4           1 12.101253  3.2928033
26     4           2 11.482337  3.1645218
27     4           3 10.648010  4.8073987
28     4           4  9.687320  5.3394193
29     4           5 12.796925  3.1197431
30     4           6  9.971434  4.6512983
31     4           7 10.239717  4.7709378
32     4           8 12.245207  2.7952426
33     5           1 18.473320  5.8421967
34     5           2 19.097212  4.9425391
35     5           3 19.460495  4.9166172
36     5           4 18.642305  4.9856035
37     5           5 17.723912  5.0594425
38     5           6 16.783248  4.8615618
39     5           7 16.100984  6.2069167
40     5           8 18.851351  3.8856152
41     6           1 19.683171  7.5568816
42     6           2 21.104231  6.7441900
43     6           3 22.115529  6.4486514
44     6           4 22.061362  5.3727434
45     6           5 22.457905  5.8665798
46     6           6 21.424413  6.0578997
47     6           7 23.475946  4.4024323
48     6           8 24.884950  4.1596914
49     7           1 25.809011  7.6756255
50     7           2 25.432828  7.7910756
51     7           3 26.790387  7.3858301
52     7           4 24.640850  8.2090606
53     7           5 26.050086  7.3779219
54     7           6 25.297148  6.8098617
55     7           7 26.551229  7.6694272
56     7           8 26.669760  6.4425772
57     8           1 26.409669  8.3040894
58     8           2 26.570003  8.4686087
59     8           3 29.018818  7.2476785
60     8           4 30.342613  4.5207729
61     8           5 26.819959  8.7935557
62     8           6 27.147711  8.3141224
63     8           7 26.168568  9.0148308
64     8           8 27.653552  8.2081808
65     9           1 34.120485  7.8415520
66     9           2 31.286463  9.7234259
67     9           3 35.763403  6.9202442
68     9           4 31.974599  9.0078286
69     9           5 32.273719  9.4954288
70     9           6 29.666208 10.2525763
71     9           7 30.949857  9.4751679
72     9           8 33.485967  8.1824810
73    10           1 36.183128 10.7891587
74    10           2 37.706116  9.7119548
75    10           3 38.582725  8.6388290
76    10           4 35.876781 10.8259279
77    10           5 37.111179  9.9805046
78    10           6 40.313149  7.7487456
79    10           7 38.606329 10.2891107
80    10           8 37.041938 10.3568765
81    11           1 42.617586 12.1619185
82    11           2 41.787495 11.1420338
83    11           3 43.944968 11.1898730
84    11           4 43.446467 10.8099599
85    11           5 43.420819 11.2696770
86    11           6 42.367318 11.6183869
87    11           7 43.543785 11.1336555
88    11           8 43.750271 12.0311065
89    12           1 46.122429 12.3528733
90    12           2 47.604306 11.4522787
91    12           3 45.568748 13.6906476
92    12           4 48.331177 12.3561907
93    12           5 47.143246 11.7339915
94    12           6 44.461190 13.3898768
95    12           7 46.879044 11.4054972
96    12           8 46.314055 12.3143487
end

eststo, title(mixed): mixed y x || id:, mle // Mixed estimator
eststo, title(GLS): xtreg y x, i(id) re     // GLS RE estimato
eststo, title(MLE): xtreg y x, i(id) mle    // MLE RE estimator 
eststo, title(Within): xtreg y x, i(id) fe  // FE Within estimator 
eststo, title(Between): xtreg y x, i(id) be // Between estimator 

esttab *, b(a5) se(a5) mtitle 

+1. Gracias, Dimitriy, definitivamente es útil ver la salida de Stata en el mismo conjunto de datos de juguete. Tengo una pregunta sobre el estimador MLE. Pensé que el enfoque de modelo mixto ( mixeden Stata y lmeren R) también es la probabilidad máxima o, a veces, la "probabilidad máxima restringida" (puedo usar ambos en mi lmerllamada configurando REML=To REML=Fy dan resultados casi idénticos). Sin embargo, el enfoque de modelo mixto da un resultado muy sensible y correcto, mientras que lo que Stat llama "MLE" da un resultado sin sentido en este caso. ¿Cuál es la diferencia? ¿A qué se refiere exactamente el "MLE" de Stat?
ameba dice Reinstate Monica

2
@amoeba Ambos mixed, mley xtreg, mleson estimadores MLE, pero las funciones de probabilidad son algo diferentes. Vea aquí para lo primero, y aquí para lo último. No entiendo por qué el mixedmodelo es tan robusto.
Dimitriy V. Masterov

xtmixed es lo que se llamaba mixto en versiones anteriores de Stata. Para sus datos, esa equivalencia claramente no es válida, mientras que es válida para mis datos, como sugiere el manual.
Dimitriy V. Masterov

ssc install estout Aunque recuerdo que tenía una funcionalidad diferente en diferentes versiones, y no era compatible con versiones anteriores.
StasK

1
@StasK me puso en contacto con el soporte técnico de Stata y dijeron que probablemente sea un error xtreg, mle. "En general, el resultado debería ser el mismo [...]. Este tipo de diferencias normalmente surgen cuando hay problemas de identificación en la estimación de los parámetros del modelo. [...] Verifiqué el número de condición para la varianza -matriz de covarianza resultante de ambos cálculos y ese número es básicamente infinito para -xtreg, mle- y más de 4000 para -mixed, mle-. [...] los desarrolladores evaluarán el problema para determinar si se necesita un código fijo ".
ameba dice Reinstate Monica

9

Déjame confundir las cosas aún más:

ECONOMETRÍA - ENFOQUE DE EFECTOS FIJOS
El enfoque de "efectos fijos" en econometría para datos de panel, es una forma de estimar los coeficientes de pendiente (las betas), "evitando" la existencia de la variable de efectos individualesαyoy, por lo tanto, al no suponer si es "fijo" o "aleatorio". Esto es lo que hacen el estimador de "Primera diferencia" (usando las primeras diferencias de los datos) y el estimador "Dentro" (usando las desviaciones de los promedios de tiempo): logran estimar solo las betas.

Para un enfoque más tradicional que trata explícitamente los efectos individuales (las "intercepciones") como constantes, utilizamos el Estimador de la variable ficticia de mínimos cuadrados (LSDV), que también proporciona estimaciones para αyoNota: en el modelo lineal, los tres estimadores coinciden algebraicamente con respecto a las estimaciones producidas para las betas, pero solo en el modelo lineal.

Discusión (parcialmente extraída de las notas de la clase)

"La principal ventaja del enfoque de efectos fijos es que no necesitamos hacer suposiciones sobre la naturaleza de los efectos individuales. Deberíamos aplicarlo siempre que sospechemos que estos últimos están correlacionados con uno o más de los regresores ya que en este caso ignorar la presencia de dicha correlación y aplicar OLS ingenuamente en el modelo agrupado produce estimadores inconsistentes. A pesar de su atractivo debido a las suposiciones mínimas que necesitamos hacer con respecto a los efectos individuales, el enfoque de efectos fijos tiene ciertas limitaciones. Primero, los coeficientes de tiempo los regresores invariantes no pueden estimarse ya que estas variables se diferencian junto con los efectos individuales no observables.los efectos individuales (en caso de que usemos el estimador LSDV) no pueden estimarse consistentemente (excepto si dejamos que la dimensión del tiempo llegue al infinito) ".

ECONOMETRÍA - ENFOQUE DE EFECTOS ALEATORIOS
En el enfoque de efectos aleatorios econométricos "tradicionales" suponemos que las "intercepciones" individualesαyo son "componentes aleatorios permanentes", mientras que los términos de error "habituales" son componentes de error "transitorios".

En una extensión interesante, la aleatoriedad adicional surge de la existencia de un efecto de tiempo aleatorio , común a todas las secciones transversales pero variable en el tiempo , junto con un efecto individual fijo (constante) y el término de error. Este "efecto temporal", por ejemplo, puede representar un shock agregado a nivel de toda la economía que afecta por igual a todos los hogares. Tales perturbaciones agregadas se observan de hecho y, por lo tanto, parece ser una opción de modelado realista.

Aquí el estimador de "efectos aleatorios" es un estimador de mínimos cuadrados generalizados (GLS), para una mayor eficiencia.

Ahora, un estimador más concebido, el Estimador "Entre", realiza OLS en las observaciones promediadas en el tiempo. Como cuestión de álgebra, se ha demostrado que el estimador GLS puede obtenerse como un promedio ponderado de los estimadores dentro y entre, donde los pesos no son arbitrarios sino que se relacionan con las matrices VCV de los dos.

... y también están las variantes de los modelos "Efectos aleatorios no correlacionados" y "Efectos aleatorios correlacionados".

Espero que la ayuda anterior haga el contraste con los modelos de "efectos mixtos".


+1, gracias Alecos. Esto es útil, pero la relación de todo eso con el enfoque de modelos mixtos no me resulta clara. Empiezo a sospechar que tal vez no exista relación alguna. Los estimadores intermedios y internos (y que el interno es equivalente a los maniquíes de clase) son claros por cierto; Mi confusión es solo sobre el enfoque de efectos aleatorios.
ameba dice Reinstate Monica
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.