Si la hipótesis B es la hipótesis interesante, puede tomar no-B como la hipótesis nula y controlar, bajo la nula, la probabilidad del error de tipo I por rechazar erróneamente no-B en el nivel . Rechazar no-B se interpreta como evidencia a favor de B porque controlamos el error tipo I, por lo tanto, es poco probable que no-B sea cierto. Confundido ...? α
Tomemos el ejemplo de tratamiento versus ningún tratamiento en dos grupos de una población. La hipótesis interesante es que el tratamiento tiene un efecto, es decir, hay una diferencia entre el grupo tratado y el grupo no tratado debido al tratamiento. La hipótesis nula es que no hay diferencia, y controlamos la probabilidad de rechazar erróneamente esta hipótesis. Por lo tanto, controlamos la probabilidad de concluir erróneamente que hay un efecto de tratamiento cuando no hay efecto de tratamiento. El error tipo II es la probabilidad de aceptar erróneamente el valor nulo cuando hay un efecto de tratamiento.
La formulación anterior se basa en el marco de Neyman-Pearson para pruebas estadísticas, donde las pruebas estadísticas se consideran un problema de decisión entre casos, lo nulo y lo alternativo. El nivel es la fracción de veces que cometemos un error tipo I si (independientemente) repetimos la prueba. En este marco, realmente no hay ninguna distinción formal entre lo nulo y lo alternativo. Si intercambiamos el nulo y la alternativa, intercambiamos la probabilidad de errores de tipo I y tipo II. Sin embargo, no controlamos la probabilidad de error de tipo II anterior (depende de cuán grande sea el efecto del tratamiento), y debido a esta asimetría, podemos preferir decir que no rechazamosαla hipótesis nula (en lugar de eso aceptamos la hipótesis nula). Por lo tanto, debemos tener cuidado al concluir que la hipótesis nula es verdadera solo porque no podemos rechazarla.
En un marco de prueba de significancia de Fisher realmente solo hay una hipótesis nula y se calcula, bajo el nulo, un valor para los datos observados. Los valores p más pequeños se interpretan como evidencia más fuerte contra el nulo. Aquí la hipótesis nula definitivamente no es B (sin efecto del tratamiento) y el valor p se interpreta como la cantidad de evidencia contra el nulo. Con un valor p pequeño , podemos rechazar con confianza el valor nulo, que no hay efecto del tratamiento, y concluir que existe un efecto del tratamiento. En este marco solo podemos rechazar o no rechazar (nunca aceptar) el nulo, y se trata de falsificar el nulo. Tenga en cuenta que la ppagpagpagpagpag-valor no necesita ser justificado por un número repetido (imaginario) de decisiones.
Ninguno de los marcos está exento de problemas, y la terminología a menudo es confusa. Puedo recomendar el libro Evidencia estadística: un paradigma de probabilidad de Richard M. Royall para un tratamiento claro de los diferentes conceptos.