Si y no.
Primero el "si"
Lo que ha observado es que cuando una prueba y un intervalo de confianza se basan en la misma estadística, existe una equivalencia entre ellos: podemos interpretar el valor como el valor más pequeño de para el cual el valor nulo del parámetro se incluiría en el intervalo de confianza .pα1−α
Deje que sea un parámetro desconocido en el espacio de parámetros , y deje que la muestra sea una realización de la variable aleatoria . Para simplificar, defina un intervalo de confianza como un intervalo aleatorio tal que su probabilidad de cobertura
(De manera similar, podría considerar intervalos más generales, donde la probabilidad de cobertura está limitada o aproximadamente igual a . El razonamiento es análogo).θΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX=(X1,…,Xn)Iα(X)
Pθ(θ∈Iα(X))=1−αfor all α∈(0,1).
1−α
Considere una prueba de dos lados de la hipótesis de punto nulo contra la alternativa . Deje que denote el valor p de la prueba. Para cualquier , se rechaza en el nivel if . La región de rechazo de nivel es el conjunto de que conduce al rechazo de :
H0(θ0):θ=θ0H1(θ0):θ≠θ0λ(θ0,x)α∈(0,1)H0(θ0)αλ(θ0,x)≤αα xH0(θ0)
Rα(θ0)={x∈Rn:λ(θ0,x)≤α}.
Ahora, considere una familia de pruebas de dos lados con valores p , para . Para dicha familia podemos definir una región de rechazo invertidaλ(θ,x)θ∈Θ
Qα(x)={θ∈Θ:λ(θ,x)≤α}.
Para cualquier fija , se rechaza si , lo que sucede si y solo si , es decir,
Si la prueba se basa en una estadística de prueba con una distribución nula absolutamente continua completamente especificada, entonces bajo . Entonces
Dado que esta ecuación se cumple para cualquierθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)
x∈Rα(θ0)⇔θ0∈Qα(x).
λ(θ0,X)∼U(0,1)H0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θy dado que la ecuación anterior implica que se deduce que el conjunto aleatorio siempre cubre el parámetro verdadero con probabilidad . En consecuencia, dejar que denote el complemento de , para todos tenemos
lo que significa que el complemento de la región de rechazo invertido es un intervalo de confianza para .
Pθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
Qα(x)θ0αQCα(x)Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
A continuación se muestra una ilustración que muestra las regiones de rechazo y los intervalos de confianza correspondientes a la prueba para una media normal, para diferentes medias nulas y diferentes medias de muestra , con . se rechaza si está en la región sombreada de color gris claro. En gris oscuro se muestra la región de rechazo y el intervalo de confianza .
zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Gran parte de esto está tomado de mi tesis doctoral ).
Ahora para el "no"
Arriba describí la forma estándar de construir intervalos de confianza. En este enfoque, usamos algunas estadísticas relacionadas con el parámetro desconocido para construir el intervalo. También hay intervalos basados en algoritmos de minimización, que tratan de minimizar la longitud de la condición intervalo en el valor de . Por lo general, dichos intervalos no corresponden a una prueba.θX
Este fenómeno tiene que ver con problemas relacionados con que dichos intervalos no estén anidados, lo que significa que el intervalo del 94% puede ser más corto que el intervalo del 95%. Para más información sobre esto, consulte la Sección 2.5 de este reciente trabajo mío (que aparecerá en Bernoulli).
Y un segundo "no"
En algunos problemas, el intervalo de confianza estándar no se basa en la misma estadística que la prueba estándar (como lo discutió Michael Fay en este documento ). En esos casos, los intervalos de confianza y las pruebas pueden no dar los mismos resultados. Por ejemplo, puede ser rechazado por la prueba aunque 0 esté incluido en el intervalo de confianza. Esto no contradice el "sí" anterior, ya que se utilizan estadísticas diferentes.θ0=0
Y a veces "sí" no es algo bueno
Como señala f coppens en un comentario, a veces los intervalos y las pruebas tienen objetivos algo conflictivos. Queremos intervalos cortos y pruebas con alta potencia, pero el intervalo más corto no siempre corresponde a la prueba con la potencia más alta. Para algunos ejemplos de esto, vea este artículo (distribución normal multivariante), o este (distribución exponencial), o la Sección 4 de mi tesis .
Los bayesianos también pueden decir sí y no
Hace algunos años, publiqué una pregunta aquí sobre si existe una equivalencia de intervalo de prueba también en las estadísticas bayesianas. La respuesta corta es que, utilizando pruebas de hipótesis Bayesianas estándar, la respuesta es "no". Sin embargo, al reformular un poco el problema de las pruebas, la respuesta puede ser "sí". (¡Mis intentos de responder mi propia pregunta finalmente se convirtieron en un papel !)