La corrección de '' prueba múltiple '' es necesaria siempre que 'infle el error tipo I': por ejemplo, si realiza dos pruebas, cada una con un nivel de confianza , y para la primera probamos el nulo contra la alternativa y la segunda hipótesis versus . α=5%H(1)0H(1)1H(2)0H(2)1
Entonces sabemos que el error tipo I para, por ejemplo, la primera hipótesis es la probabilidad de rechazar falsamente y es .H(1)0α=5%
Si realiza las dos pruebas, entonces la probabilidad de que al menos una de las dos sea falsamente rechazada es igual a 1 menos la probabilidad de que ambas sean aceptadas, entonces que, para es igual a , por lo que el error de tipo uno de tener al menos un falso rechazo casi se ha duplicado.1−(1−α)2α=5%9.75%
En la prueba de hipótesis estadísticas, uno solo puede encontrar evidencia estadística para la hipótesis alternativa al rechazar el nulo, rechazar el nulo nos permite concluir que hay evidencia a favor de la hipótesis alternativa. (ver también ¿Qué sigue si no rechazamos la hipótesis nula? ).
Entonces, un falso rechazo de lo nulo nos da evidencia falsa, por lo que una falsa creencia de la "verdad científica". Es por eso que esta inflación tipo I (la casi duplicación del error tipo I) debe evitarse; Los errores de tipo I más altos implican más creencias falsas de que algo está científicamente probado . Por lo tanto, las personas "controlan" el tipo Ierror a nivel familiar.
Si hay un equipo de investigadores que realiza múltiples pruebas, cada vez que rechazan la hipótesis nula, concluyen que han encontrado evidencia estadística de una verdad científica. Sin embargo, por lo anterior, muchos más del de estas conclusiones son una falsa creencia de la "verdad científica". 5%
Por el mismo razonamiento, lo mismo ocurre si varios equipos realizan estas pruebas (con los mismos datos).
Obviamente, los hallazgos anteriores solo se mantienen si los equipos trabajamos con los mismos datos . ¿Qué es diferente cuando trabajan en diferentes muestras?
Para explicar esto, tomemos un ejemplo simple y poco realista. Nuestra hipótesis nula es que una población tiene una distribución normal, con conocida y los estados nulos que contra . Tomemos el nivel de significancia .σH0:μ=0H1:μ≠0α=5%
Nuestra muestra ('los datos') es solo una observación, por lo que rechazaremos el valor nulo cuando la observación sea mayor que o menor que .1.96 σ - 1.96 σo1.96σ−1.96σ
Cometemos un error tipo I con una probabilidad de porque podría ser que rechacemos por casualidad, de hecho, si es verdadero (por lo que la población es normal y ), entonces existe (con verdadero ) una posibilidad de que ]. Entonces, incluso si es cierto, entonces existe la posibilidad de que tengamos mala suerte con los datos. H 0 H 0 μ = 0 H 0 o ∉ [ - 1.96 σ ; 1,96 σ H 05%H0H0μ=0H0o∉[−1.96σ;1.96σH0
Entonces, si usamos los mismos datos, podría ser que las conclusiones de las pruebas se basen en una muestra que se extrajo con "mala probabilidad". Con otra muestra, el contexto es diferente.