Modelo de regresión lineal que mejor se adapta a datos con errores


9

Estoy buscando el algoritmo de regresión lineal que sea más adecuado para datos cuya variable independiente (x) tiene un error de medición constante y la variable dependiente (y) tiene un error dependiente de la señal.

ingrese la descripción de la imagen aquí

La imagen de arriba ilustra mi pregunta.


1
Si la variable constante x tiene un error de medición constante, y los errores se usan solo para ponderar las variables de forma relativa, ¿no es esta situación equivalente a no tener errores en x?
pedrofigueira

2
@pedro Ese no es el caso, porque los errores en no son meras ponderaciones en una fórmula. Con la regresión de errores en variables, los ajustes diferirán y las estimaciones de covarianza de los parámetros diferirán de la regresión ordinaria. x
whuber

1
Gracias por la aclaración. ¿Podría ampliar un poco sobre por qué ese es el caso?
pedrofigueira

Respuestas:


2

Error de medida en la variable dependiente

Dado un modelo lineal general con homosckedastic, no autocorrelacionado y no correlacionado con las variables independientes, deje que denote la variable "verdadera", y su medida observable El error de medición se define como su diferencia Por lo tanto, el modelo estimable es: Dado que son observado, podemos estimar el modelo por OLS. Si el error de medición en es estadísticamente independiente de cada variable explicativa, entonces εyye=y-y y = β 0 + β 1 x 1 + + β k x k + e + ε y,x1,...,xky(e+

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xkyε t e(e+ε)comparte las mismas propiedades que y los procedimientos de inferencia OLS habituales ( estadísticas, etc.) son válidos. Sin embargo, en su caso, esperaría una variación creciente de . Podrías usar:εte
  • un estimador ponderado de mínimos cuadrados (por ejemplo, Kutner et al. , §11.1; Verbeek , §4.3.1-3);

  • el estimador OLS, que aún es imparcial y consistente, y los errores estándar consistentes con la heterocedasticidad, o simplemente los errores estándar de Wite ( Verbeek , §4.3.4).

Error de medida en la variable independiente

Dado el mismo modelo lineal que el anterior, dejemos que denote el valor "verdadero" y su medida observable. El error de medición es ahora: Hay dos situaciones principales ( Wooldridge , §4.4.2). x k e kxkxk

ek=xkxk
  • x k x k = xCov(xk,ek)=0 : el error de medición no está correlacionado con la medida observada y, por lo tanto, debe correlacionarse con la variable no observada ; escribir y enchufar esto en (1): ya que y ambos no están correlacionados con cada , incluyendo , la medición solo aumenta la varianza del error y no viola ninguno de los supuestos de OLS;xkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • x k y x 1 , , x kCov(xk,ηk)=0 : el error de medición no está correlacionado con la variable no observada y, por lo tanto, debe correlacionarse con la medida observada ; tal correlación causa problemas y la regresión de OLS de en generalmente da estimadores sesgados y sin consistencia.xkyx1,,xk

Hasta donde puedo adivinar mirando su gráfico (errores centrados en los valores "verdaderos" de la variable independiente), podría aplicarse el primer escenario.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.