¿Cómo probar si las pendientes en el modelo lineal son iguales a un valor fijo?


9

Supongamos que tenemos un modelo de regresión lineal simple y nos gustaría probar la hipótesis nula contra la alternativa general.H 0 : a = b = 1Z=aX+bYH0:a=b=12

Creo que uno puede usar la estimación de y y luego aplicar una prueba para obtener el intervalo de confianza alrededor de . ¿Esta bien? SE( un )Z1a^SE(a^)Z12

La otra pregunta está fuertemente relacionada con esta. Supongamos que tenemos una muestra y calculamos estadísticasχ 2{(x1,y1,z1),,(xn,yn,zn)}χ2

i=1n(zixi+yi2)2xi+yi2.
¿Se pueden usar estas estadísticas para probar la misma hipótesis nula?

Respuestas:


8

En la regresión lineal, la suposición es que e no son variables aleatorias. Por lo tanto, el modeloYXY

Z=aX+bY+ϵ

es algebraicamente lo mismo que

Z12X12Y=(a12)X+(b12)Y+ϵ=αX+βY+ϵ.

Aquí, y . El término de error no se ve afectado. Ajuste este modelo, estimando los coeficientes como y , respectivamente, y pruebe la hipótesis de la manera habitual. β=b-1α=a12 varepsilon alpha β alpha=β=0β=b12ϵα^β^α=β=0


La estadística escrita al final de la pregunta no es una estadística de chi-cuadrado, a pesar de su similitud formal con una. Una estadística de chi cuadrado implica recuentos , no valores de datos, y debe tener valores esperados en su denominador, no covariables. Es posible que uno o más de los denominadores sean cero (o cercanos), lo que demuestra que algo está mal con esta formulación. Si incluso eso no es convincente, considere que las unidades de medida de , e podrían ser cualquier cosa (como drams, parsecs y picotazos), de modo que una combinación lineal como (en general) no tiene sentido. No prueba nada. ZXYzi-(xi+yi)/2xi+yi2ZXYzi(xi+yi)/2


1
Gracias por tu respuesta. Fue muy útil. En realidad, no fui muy preciso en la formulación de la segunda parte de la pregunta. Imagina que xs e ys son números positivos, medidos en las mismas unidades. El zs (resultado observado) de alguna manera mide la "interacción" en ese sentido que si no hay interacción, el zs debería ser (x + y) / 2 (resultado esperado). Entonces, desde mi punto de vista, era lo mismo usar la regresión con la hipótesis nula a = b = 1/2 o comparar la bondad de ajuste utilizando las estadísticas de chi ^ 2 de Pearson. ¿Tiene esto algún sentido? ¡Gracias!
Lan

1
@Lan Creo que la respuesta de Wolfgang ilustra muy bien cómo hacer la prueba que estás proponiendo. Es un ejemplo de lo que significa probar una hipótesis "de la manera habitual".
whuber

9

Puede probar esta hipótesis con una prueba de modelo completa versus reducida. Así es como haces esto. Primero, ajuste el modelo y obtenga los residuos de ese modelo. Al cuadrado los residuos y sumarlos. Esta es la suma del error cuadrado para el modelo completo. Llamemos a esto . A continuación, calcular , donde . Estos son sus residuos bajo la hipótesis nula. Cuadrarlos y resumirlos. Esta es la suma del error cuadrado para el modelo reducido. Llamemos a esto .S S E f Z - Z Z = 1 / 2 * X + 1 / 2 * Y S S E rZ=aX+bYSSEfZZ^Z^=1/2X+1/2YSSEr

Ahora calcule:

F = ,((SSErSSEf)/2)/(SSEf/(n2))

donde es el tamaño de la muestra. Bajo , esta estadística F sigue una distribución F con y grados de libertad.H 0 2 n - 2nH02n2

Aquí hay un ejemplo usando R:

x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here

res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)

zhat  <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)

F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value

Rechace el valor nulo si el valor p está por debajo de .05 (si su es de hecho .05).α

Supongo que realmente quisiste que tu modelo no contuviera una intercepción. En otras palabras, supongo que realmente está trabajando con el modelo y no .Z = c + a X + b YZ=aX+bYZ=c+aX+bY

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.