Un comentario en otra pregunta planteó dudas sobre la importancia de la condición , argumentando que se puede corregir mediante la inclusión de un término constante en la especificación de regresión, por lo que "se puede ignorar fácilmente".E(u∣X)=0
Esto no es asi. La inclusión de un término constante en la regresión absorberá la media condicional posiblemente distinta de cero del término de error si suponemos que esta media condicional ya es una constante y no una función de los regresores . Esta es la suposición crucial que debe hacerse independientemente de si incluimos un término constante o no:
E(u∣X)=const.
Si esto se cumple, entonces la media distinta de cero se convierte en una molestia que simplemente podemos resolver al incluir un término constante.
Pero si esto no se cumple (es decir, si la media condicional no es una constante cero o no constante ), la inclusión del término constante no resuelve el problema: lo que "absorberá" en este caso es una magnitud eso depende de la muestra específica y las realizaciones de los regresores. En realidad, el coeficiente desconocido asociado a la serie de unos, no es realmente una constante sino variable, dependiendo de los regresores a través de la media condicional no constante del término de error.
¿Qué implica esto?
Para simplificar, suponga el caso más simple, donde ( i indexa las observaciones) pero que E ( u i ∣ x i ) = h ( x i ) . Es decir, que el término de error es media-independiente de las variables explicativas, excepto de los de informes contemporáneas (en X nosotros no incluimos una serie de unos).E(ui∣X−i)=0iE(ui∣xi)=h(xi)X
Suponga que especificamos la regresión con la inclusión de un término constante (un regresor de una serie de unos).
y=a+Xβ+ε
y notación compactadora
y=Zγ+ε
donde , Z = [ 1 : X ] , γ = ( un , ß ) ' , ε = u - una .a=(a,a,a...)′Z=[1:X]γ=(a,β)′ε=u−a
Entonces el estimador OLS será
γ^=γ+(Z′Z)−1Z′ε
Para la imparcialidad necesitamos . PeroE[ε∣Z]=0
E[εi∣xi]=E[ui−a∣xi]=h(xi)−a
que no puede ser cero para todo , ya que examinamos el caso donde h ( x i ) no es una función constante. Entoncesih(xi)
E[ε∣Z]≠0⟹E(γ^)≠γ
y
Si , incluso si incluimos un término constante en la regresión, el estimador OLS no será imparcial , lo que significa que también se pierde el resultado de Gauss-Markov sobre la eficienciaE(ui∣xi)=h(xi)≠h(xj)=E(uj∣xj) .
εii
uiγ^−γ
E(ui∣xi)=h(xi)≠h(xj)=E(uj∣xj), then even if we include a constant term in the regression, Hypothesis testing is no longer valid.
In other words, "finite-sample" properties are all gone.
We are left only with the option to resort to asymptotically valid inference, for which we will have to make additional assumptions.
So simply put, Strict Exogeneity cannot be "easily ignored".