No rechazar una hipótesis nula es evidencia de que la hipótesis nula es verdadera, pero podría no ser una evidencia particularmente buena , y ciertamente no prueba la hipótesis nula.
Hagamos un pequeño desvío. Considere por un momento el viejo cliché:
La ausencia de evidencia no es evidencia de ausencia.
A pesar de su popularidad, esta afirmación no tiene sentido. Si busca algo y no lo encuentra, eso es absolutamente evidencia de que no está allí. Lo buena que sea esa evidencia depende de cuán exhaustiva fue su búsqueda. Una búsqueda superficial proporciona evidencia débil; Una búsqueda exhaustiva proporciona pruebas contundentes.
Ahora, de vuelta a la prueba de hipótesis. Cuando ejecuta una prueba de hipótesis, está buscando evidencia de que la hipótesis nula no es cierta. Si no lo encuentra, entonces eso es ciertamente evidencia de que la hipótesis nula es cierta, pero ¿qué tan fuerte es esa evidencia? Para saberlo, debe saber qué tan probable es que la evidencia que lo hubiera hecho rechazar la hipótesis nula podría haber eludido su búsqueda. Es decir, ¿cuál es la probabilidad de un falso negativo en su prueba? Esto está relacionado con el poder, , de la prueba (específicamente, es el complemento, 1- ).βββ
Ahora, el poder de la prueba y, por lo tanto, la tasa de falsos negativos, generalmente depende del tamaño del efecto que está buscando. Los efectos grandes son más fáciles de detectar que los pequeños. Por lo tanto, no hay una única para un experimento y, por lo tanto, no hay una respuesta definitiva a la pregunta de qué tan fuerte es la evidencia de la hipótesis nula. Dicho de otra manera, siempre hay un tamaño de efecto lo suficientemente pequeño como para que el experimento no lo descarte.β
A partir de aquí, hay dos formas de proceder. A veces sabes que no te importa un tamaño de efecto más pequeño que un umbral. En ese caso, probablemente debería replantear su experimento de modo que la hipótesis nula sea que el efecto está por encima de ese umbral, y luego probar la hipótesis alternativa de que el efecto está por debajo del umbral. Alternativamente, puede usar sus resultados para establecer límites en el tamaño creíble del efecto. Su conclusión sería que el tamaño del efecto se encuentra en algún intervalo, con cierta probabilidad. Ese enfoque está a solo un pequeño paso de un tratamiento bayesiano, del que tal vez quiera aprender más, si se encuentra con frecuencia en este tipo de situación.
Hay una buena respuesta a una pregunta relacionada que toca pruebas de pruebas de ausencia , que pueden serle útiles.