Error de medida en la variable dependiente
Dado un modelo lineal general
con homosckedastic, no autocorrelacionado y no correlacionado con las variables independientes, deje que denote la variable "verdadera", y su medida observable El error de medición se define como su diferencia
Por lo tanto, el modelo estimable es:
Dado que son observado, podemos estimar el modelo por OLS. Si el error de medición en es estadísticamente independiente de cada variable explicativa, entonces εy∗ye=y-y∗ y = β 0 + β 1 x 1 + ⋯ + β k x k + e + ε y,x1,...,xky(e+
y= β0 0+ β1X1+ ⋯ + βkXk+ ε(1)
εy∗ye = y- y∗
y= β0 0+β1X1+ ⋯ +βkXk+ e + ε(2)
y, x1, ... , xkyε t e( e + ε )comparte las mismas propiedades que y los procedimientos de inferencia OLS habituales ( estadísticas, etc.) son válidos. Sin embargo, en su caso, esperaría una variación creciente de . Podrías usar:
εte
un estimador ponderado de mínimos cuadrados (por ejemplo, Kutner et al. , §11.1; Verbeek , §4.3.1-3);
el estimador OLS, que aún es imparcial y consistente, y los errores estándar consistentes con la heterocedasticidad, o simplemente los errores estándar de Wite ( Verbeek , §4.3.4).
Error de medida en la variable independiente
Dado el mismo modelo lineal que el anterior, dejemos que denote el valor "verdadero" y su medida observable. El error de medición es ahora:
Hay dos situaciones principales ( Wooldridge , §4.4.2). x k e kx∗kxk
ek=xk−x∗k
x ∗ k x ∗ k = xCov(xk,ek)=0 : el error de medición no está correlacionado con la medida observada y, por lo tanto, debe correlacionarse con la variable no observada ; escribir y enchufar esto en (1):
ya que y ambos no están correlacionados con cada , incluyendo , la medición solo aumenta la varianza del error y no viola ninguno de los supuestos de OLS;x∗kx∗k=xk−ek
y=β0+β1x1+⋯+βkxk+(ε−βkek)
εexjxk
x k y x 1 , … , x kCov(x∗k,ηk)=0 : el error de medición no está correlacionado con la variable no observada y, por lo tanto, debe correlacionarse con la medida observada ; tal correlación causa problemas y la regresión de OLS de en generalmente da estimadores sesgados y sin consistencia.xkyx1,…,xk
Hasta donde puedo adivinar mirando su gráfico (errores centrados en los valores "verdaderos" de la variable independiente), podría aplicarse el primer escenario.