Puede probar esta hipótesis con una prueba de modelo completa versus reducida. Así es como haces esto. Primero, ajuste el modelo y obtenga los residuos de ese modelo. Al cuadrado los residuos y sumarlos. Esta es la suma del error cuadrado para el modelo completo. Llamemos a esto . A continuación, calcular , donde . Estos son sus residuos bajo la hipótesis nula. Cuadrarlos y resumirlos. Esta es la suma del error cuadrado para el modelo reducido. Llamemos a esto .S S E f Z - Z Z = 1 / 2 * X + 1 / 2 * Y S S E rZ=aX+bYSSEfZ−Z^Z^=1/2∗X+1/2∗YSSEr
Ahora calcule:
F = ,((SSEr−SSEf)/2)/(SSEf/(n−2))
donde es el tamaño de la muestra. Bajo , esta estadística F sigue una distribución F con y grados de libertad.H 0 2 n - 2nH02n−2
Aquí hay un ejemplo usando R:
x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here
res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)
zhat <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)
F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value
Rechace el valor nulo si el valor p está por debajo de .05 (si su es de hecho .05).α
Supongo que realmente quisiste que tu modelo no contuviera una intercepción. En otras palabras, supongo que realmente está trabajando con el modelo y no .Z = c + a X + b YZ=aX+bYZ=c+aX+bY