Considere el siguiente modelo de regresión múltiple:
Aquí es un vector de columna ; a matriz; a vector de columna; a matriz; a vector de columna; y , el término de error, un vector de columna .
PREGUNTA
Mi profesor, el libro de texto Introducción a la Econometría, 3ª ed. por James H. Stock y Mark W. Watson, p. 281, y Econometría: sesión de revisión del examen de honor (PDF) , pág. 7, me ha expresado lo siguiente.
- Si asumimos lo que se llama independencia media condicional , que por definición significa que
y si se cumple el supuesto de mínimos cuadrados, excepto el supuesto condicional de media cero (entonces suponemos que ) (ver 1 -3 a continuación),
entonces, el estimador OLS de en permanece imparcial y consistente, bajo este conjunto más débil de suposiciones.
¿Cómo pruebo esta proposición? Es decir, que 1 y 2 anteriores implican que la estimación OLS de nos da un estimador imparcial y consistente para . ¿Hay algún artículo de investigación que pruebe esta proposición?
COMENTARIO
El caso más simple se da considerando el modelo de regresión lineal y demuestra que la estimación de OLS de es imparcial si para cada .
PRUEBA DE UNBIASEDNESS ASUMIENDO QUE y ESTÁN DISTRIBUIDAS DE FORMA COMÚN NORMALMENTE
Defina , luego yPor lo tanto puede reescribirse como Por se deduce que Ahora, dado que y se distribuyen normalmente de manera conjunta, la teoría de las distribuciones normales, cf. Derivando las distribuciones condicionales de una distribución normal multivariada , dice que (de hecho, no necesitamos asumir la normalidad conjunta sino solo esta identidad) para algún vector por
Ahora convierte en Para el modelo se cumplen todos los supuestos de mínimos cuadrados, ya que el término de error satisface el supuesto de condicional media cero Esto implica que la estimación de OLS de será imparcial, ya que si dejamos , y dejamos que sea por matriz compuesta de y , entonces la estimación de MCO de en se da considerando lo siguiente:
y así donde la segunda línea sigue por . Por lo tanto, es una estimación condicionalmente imparcial de ya que la estimación OLS dada para el modelo coinicide con la dada para el modelo . Ahora, según la ley de expectativa total y, por lo tanto, es un estimador imparcial de .
(Se puede notar que , de modo que el coeficiente de no es necesariamente imparcial).
Sin embargo, el caso especial anterior supone que y se distribuyen normalmente de manera conjunta, ¿cómo pruebo la proposición sin esta suposición?
Suponiendo que siempre es suficiente por supuesto (cf. ), pero se supone que obtengo el resultado simplemente usando y el supuesto de mínimos cuadrados excluyendo el supuesto de Condicional Media Cero ( vea abajo).
CON RESPECTO A LA CONSISTENCIA
Creo que también se puede ver que la estimación es consistente para al notar que en el modelo de regresión se cumplen todas las suposiciones de mínimos cuadrados, incluida la suposición de que el (nuevo) término de error satisface el Supuesto condicional de media cero (cf. y ver más abajo).
Puedo agregar una prueba de consistencia más adelante que se basa en una serie de ejercicios en Introducción a la Econometría, 3ª ed. por James H. Stock y Mark W. Watson, cap. 18. Sin embargo, esta prueba es bastante larga. Pero el punto aquí es que la prueba proporcionada en los ejercicios supone , por lo que todavía me pregunto si la suposición realmente es suficiente.
SUBQUERÍA 1
En Introducción a la Econometría, 3ª ed. por James H. Stock y Mark W. Watson, se dice, en la pág. 300, que el supuesto se puede "relajar" usando la teoría de la regresión no lineal. ¿Qué quieren decir o qué quieren decir con esto?
LOS MENOS CUESTIONES DE CUADRADOS
Aquí excluyo la suposición media condicional cero de que ya que la proposición que intentamos probar aquí permite casos en los que . Estos son por ejemplo los casos en que se correlaciona con . Cf. Econometría: Sesión de revisión del examen de honor (PDF) , pág. 7)
Los supuestos de mínimos cuadrados son los siguientes.
Las distribuciones conjuntas de , son iid, donde es el elemento : th en y donde y son los vectores : th fila en y .
Los grandes valores atípicos son poco probable, es decir, para cada , y tienen cuarto momentos finitos, donde es el -ésimo elemento en .
tiene un rango de columna completo (es decir, no existe una multicolinealidad perfecta; esto garantiza la invertibilidad de ).
( Supuestos de mínimos cuadrados extendidos : si bien no creo que esto sea necesario (y se me ha dicho que no lo es), también podemos suponer homoscedasticidad, es decir, para cada , y que la distribución condicional de dada es normal para cada (es decir, tenemos errores normales).
NOTA SOBRE TERMINOLOGÍA
En , la suposición media condicional cero es la suposición de que . El supuesto de independencia media condicional, sin embargo, es el supuesto de que .
Esta terminología se utiliza, por ejemplo, en Introducción a la Econometría, 3ª ed. por James H. Stock y Mark W. Watson, p. 281; y Análisis econométrico de datos de sección transversal y panel, 1ª ed. por Jeffrey M. Wooldridge, pág. 607. Ver también Restricciones de independencia condicional: Pruebas y estimación para discusiones similares.
PENSAMIENTOS Y SUBQUERÍA ADICIONALES 2
Creo que, al contrario de James H. Stock y Mark W. Watson, que la independencia media condicional no garantiza una estimación imparcial de MCO de . Esto se debe a que puede adoptar formas no lineales como donde es un polinomio en , o donde es un parámetro aún por estimar (aquí estoy usando la matriz exponencial ), y luego, creo, se debe aplicar una regresión no lineal , que generalmente nos deja con estimaciones sesgadas. Además, la estimación de OLS en (1) de puede no coincidir con la estimación de OLS deen si toma ciertas formas no lineales. (Psicológicamente también siento que la declaración hecha en el libro por Stock & Watson es demasiado buena para ser verdad).
Por lo tanto, una pregunta adicional es si hay algún contraejemplo a la proposición de que la independencia media condicional conduce a una estimación imparcial de MCO.
SUBQUERÍA 3
En Econometría sobre todo inofensivo, Angrist & Pischke argumenta en la subsección 3.3, p. 68-91, que bajo la independencia condicional (CI), es decir, es independiente de dado (que es una condición más fuerte, supongo, que el supuesto de independencia condicional medio dado anteriormente), hay una estrecha conexión entre las estimaciones coincidentes de el efecto de en y los coeficientes en en la regresión de en y que motiva que, bajo CI, la estimación de MCO del coeficiente en en es menos sesgado que si CI no se cumple (todo lo demás es igual).
Ahora, ¿se puede usar esta idea para responder mi pregunta principal aquí?