Es más fácil trabajar primero en el caso en que se conocen los coeficientes de regresión y, por lo tanto, la hipótesis nula es simple. Entonces la estadística suficiente es , donde es el residual; su distribución bajo nulo también es un chi-cuadrado escalado por y con grados de libertad iguales al tamaño de muestra . z σ 2 0 nT= ∑ z2zσ20 0norte
Escriba la razón de las probabilidades bajo & y confirme que es una función creciente de para cualquier : σ = σ 2 T σ 2 > σ 1σ=σ1σ=σ2Tσ2>σ1
La función de razón de probabilidad de registro es , y directamente proporcional a con gradiente positivo cuando .
ℓ(σ2;T,n)−ℓ(σ1;T,n)=n2⋅[log(σ21σ22)+Tn⋅(1σ21−1σ22)]
Tσ2>σ1
Entonces, según el teorema de Karlin-Rubin, cada una de las pruebas de una cola vs & vs es uniformemente más poderoso. Claramente no hay una prueba UMP de vs . Como se discutió aquí , llevar a cabo ambas pruebas de una cola y aplicar una corrección de comparaciones múltiples conduce a la prueba de uso común con regiones de rechazo de igual tamaño en ambas colas, y es bastante razonable cuando va a reclamar que o that cuando rechaza el valor nulo.H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ≠σ0σ>σ0σ<σ0
Luego encuentre la razón de las probabilidades bajo , la estimación de máxima verosimilitud de , & :σ=σ^σσ=σ0
Como , el estadístico de prueba de razón de probabilidad logarítmica esσ^2=Tn
ℓ(σ^;T,n)−ℓ(σ0;T,n)=n2⋅[log(nσ20T)+Tnσ20−1]
Esta es una buena estadística para cuantificar cuánto admiten los datos sobre . Y los intervalos de confianza formados por la inversión de la prueba de razón de probabilidad tienen la propiedad atractiva de que todos los valores de parámetros dentro del intervalo tienen una probabilidad más alta que los de afuera. La distribución asintótica del doble de la relación log-verosimilitud es bien conocida, pero para una prueba exacta, no necesita tratar de calcular su distribución, solo use las probabilidades de cola de los valores correspondientes de en cada cola.HA:σ≠σ0H0:σ=σ0T
Si no puede tener una prueba uniformemente más poderosa, es posible que desee una que sea más poderosa contra las alternativas más cercanas a la nula. Encuentre la derivada de la función log-verosimilitud con respecto a , la función de puntuación:σ
dℓ(σ;T,n)dσ=Tσ3−nσ
La evaluación de su magnitud en proporciona una prueba localmente más poderosa de vs . Debido a que el estadístico de prueba está delimitado a continuación, con muestras pequeñas, la región de rechazo puede limitarse a la cola superior. Nuevamente, la distribución asintótica de la puntuación al cuadrado es bien conocida, pero puede obtener una prueba exacta de la misma manera que para el LRT.σ0H0:σ=σ0HA:σ≠σ0
Otro enfoque es restringir su atención a las pruebas imparciales, es decir, aquellas para las cuales el poder bajo cualquier alternativa excede el tamaño. Verifique que su estadística suficiente tenga una distribución en la familia exponencial; luego, para una prueba de tamaño , si o , de lo contrario , puede encontrar la prueba imparcial más potente y uniforme resolviendo
αϕ(T)=1T<c1T>c2ϕ(T)=0
E(ϕ(T))E(Tϕ(T))=α=αET
Una gráfica ayuda a mostrar el sesgo en la prueba de áreas de cola iguales y cómo surge:
A valores de un poco por encima de la probabilidad aumentada de que las estadísticas de prueba 'caigan en el rechazo de rechazo de la cola superior no compensa la probabilidad reducida de que caiga en la región de rechazo de la cola inferior y el poder del la prueba cae por debajo de su tamaño.σσ0
Ser imparcial es bueno; pero no es evidente que tener una potencia ligeramente inferior al tamaño en una pequeña región del espacio de parámetros dentro de la alternativa sea tan malo como para descartar por completo una prueba.
Dos de las pruebas de dos colas anteriores coinciden (para este caso, no en general):
El LRT es UMP entre las pruebas imparciales. En los casos en que esto no sea cierto, el LRT puede ser asintóticamente imparcial.
Creo que todas, incluso las pruebas de una cola, son admisibles, es decir, no hay una prueba más poderosa o tan poderosa en todas las alternativas: puede hacer que la prueba sea más poderosa contra las alternativas en una dirección solo haciéndola menos poderosa contra las alternativas en la otra dirección. A medida que aumenta el tamaño de la muestra, la distribución de chi-cuadrado se vuelve más y más simétrica, y todas las pruebas de dos colas terminarán siendo muy parecidas (otra razón para usar la prueba fácil de colas iguales).
Con la hipótesis nula compuesta, los argumentos se vuelven un poco más complicados, pero creo que puedes obtener prácticamente los mismos resultados, mutatis mutandis. Tenga en cuenta que una, pero no la otra, de las pruebas de una cola es UMP.