Dejando de lado algunos problemas prácticos (como la medida en que es arbitraria, por ejemplo), las definiciones de nivel de significación y valor p hacen que la respuesta a esta pregunta sea inequívoca.α
Es decir, formalmente, la regla de rechazo es que rechazas cuando .p = α
Realmente solo debería importar para el caso discreto, pero en esa situación, si no rechaza cuando , ¡su tasa de error tipo I en realidad no será α !p = αα
(En lo que a mí respecta, no hay una cita 'autorizada'; realmente necesitas familiarizarte con los enfoques Neyman-Pearson y Fisherian para la prueba de hipótesis, y es algo que se desarrolló con el tiempo).
Existen varios textos estadísticos buenos que describen las pruebas de hipótesis correctamente.
La definición del valor p se da correctamente en la primera oración del artículo relevante de Wikipedia *:
el valor p es la probabilidad de obtener un estadístico de prueba al menos tan extremo como el que se observó realmente, suponiendo que la hipótesis nula sea verdadera.
* (y no, Wikipedia no es una autoridad, solo digo que la definición es correcta)
Por simplicidad, sigamos con los puntos nulos; sirve para transmitir el punto sin enturbiar las aguas con problemas adicionales.
Ahora el nivel de significancia, es la tasa de error tipo I seleccionada. Esta es la tasa que elige la hipótesis nula que se rechazará cuando sea cierta. Es decir, es la proporción del tiempo que debe rechazar el valor nulo. Ahora considere una estadística de prueba con una distribución discreta: la única vez que es posible una p de exactamente α **. (Por lo general, también será el caso de que el alfa real sea diferente de algo agradable y redondo como el 5%).αpag α
** Bueno, supongo que estoy limitando mi discusión solo a estadísticas de prueba distribuidas puramente discretas o puramente continuas. En el caso mixto, puede averiguar cómo se aplica mi discusión discreta (en las situaciones en que se aplica).
Por ejemplo, considere una prueba de signo de dos colas con , digamos. El nivel de significancia alcanzable más cercano al 5% es 4.904%. Así que vamos a elegir α = 4.904 % (o para ser más precisos, 137500n = 17α = 4.904 % ).137500217
Entonces, cuando es verdadero, ¿cuál es la tasa de rechazo si rechazamos cuando p = α ? Podemos solucionarlo. Es 4.904%, es el α que elegimos.H0 0p = αα
H0 0p = αα
p = α
p = α
Si describe su regla de rechazo por adelantado y muestra que (si se cumplen los supuestos), tiene el nivel de significancia deseado, entonces probablemente no haya necesidad de referencias.
H0 0
α
(Si tiene una edición diferente, los números de página pueden cambiar, pero tiene un índice, por lo que puede buscar términos; tenga cuidado, es posible que tenga que mirar los listados en 'Prueba de hipótesis' o algo similar en el índice para encontrar 'región de rechazo')
Hmm, intentemos otro libro del estante. Wackerly, Mendenhall & Scheaffer Mathematical Statistics with Applications, 5a edición , define una región de rechazo en p412 y un valor p (la misma definición que C&B) en p431.