El "emparedado" en cuestión son dos piezas de pan definidas por la información esperada que encierra una carne definida por la información observada. Vea mis comentarios aquí y aquí . Para una regresión lineal, la ecuación de estimación es:
U( β) = XT( Y- XTβ)
La información esperada (pan) es:
A = ∂U( β)∂β= - ( XTX )
La información observada (carne) es:
B = E( U( β) U( β)T) = XT( Y- XTβ) ( Y- XTβ)TX
Tenga en cuenta que el término interno es una diagonal de residuos constantes cuando se cumple la suposición de datos independientes de homocedasticidad, entonces el estimador de covarianza intercalado que está dado por es la matriz de covarianza de regresión lineal usual donde es la varianza de los residuos. Sin embargo, eso es bastante estricto. Obtiene una clase de estimadores considerablemente más amplia al relajar los supuestos involucrados alrededor de la matriz residual : . σ 2 ( X T X ) - 1 σ 2 n × n R = ( Y - X T β ) ( Y - X T β )UNA- 1B A- 1σ2( XTX )- 1σ2n × n
R = ( Y- XTβ) ( Y- XTβ)
El vcovHC
estimador "HC0" es consistente incluso cuando los datos no son independientes. Por lo tanto, no diré que "asumimos" que los residuos son independientes, pero diré que usamos "una estructura de covarianza independiente que funcione". Luego, la matriz se reemplaza por una diagonal de los residuosR
Ryo i= ( Yyo- βXyo.)2,0 en otro lugar
Este estimador funciona muy bien, excepto en muestras pequeñas (<40 a menudo se supone). Los HC1-3 son varias correcciones de muestras finitas. HC3 es generalmente el mejor desempeño.
Sin embargo, si hay efectos autorregresivos, las entradas fuera de la diagonal de no son cero, por lo que se produce una matriz de covarianza escalada basada en estructuras autorregresivas de uso común. Este es el fundamento de la "vcovHAC". Aquí, se producen métodos muy flexibles y generales para estimar el efecto autorregresivo: los detalles pueden estar más allá del alcance de su pregunta. La función "meatHAC" es el caballo de batalla general: el método predeterminado es Andrews. Newey-West es un caso especial del estimador de error autorregresivo general. Estos métodos resuelven uno de dos problemas: 1. a qué velocidad decae la correlación entre las observaciones "adyacentes" y 2. ¿cuál es una distancia razonable entre dos observaciones? Si tiene datos de panel equilibrados, este estimador de covarianza es excesivo.Tgee
gee
paquete en lugar de especificar la estructura de covarianza AR-1
o similar.
En cuanto a cuál usar, depende de la naturaleza del análisis de datos y de la pregunta científica. No recomendaría ajustar todos los tipos y elegir el que se vea mejor, ya que es un problema de prueba múltiple. Como mencioné anteriormente, el estimador de vcovHC es consistente incluso en presencia de un efecto autorregresivo, por lo que puede usar y justificar un "modelo de correlación de independencia de trabajo" en una variedad de circunstancias.