El siguiente extracto es de la entrada, ¿Cuáles son las diferencias entre las pruebas de una y dos colas? , en el sitio de ayuda de estadísticas de UCLA.
... considere las consecuencias de perder un efecto en la otra dirección. Imagine que ha desarrollado un nuevo medicamento que cree que es una mejora con respecto a un medicamento existente. Desea maximizar su capacidad para detectar la mejora, por lo que opta por una prueba de una cola. Al hacerlo, no prueba la posibilidad de que el nuevo medicamento sea menos efectivo que el medicamento existente.
Después de aprender los conceptos básicos absolutos de las pruebas de hipótesis y llegar a la parte sobre las pruebas de una o dos colas ... Entiendo las matemáticas básicas y la mayor capacidad de detección de las pruebas de una cola, etc. Pero no puedo entenderlo. alrededor de una cosa ... ¿Cuál es el punto? Realmente no entiendo por qué debería dividir su alfa entre los dos extremos cuando el resultado de la muestra solo puede estar en uno u otro, o en ninguno.
Tome el escenario de ejemplo del texto citado arriba. ¿Cómo podría "no probar" un resultado en la dirección opuesta? Tienes tu media de muestra. Tienes tu media de población. La aritmética simple te dice cuál es más alto. ¿Qué hay para probar, o no probar, en la dirección opuesta? ¿Qué te detiene al comenzar de cero con la hipótesis opuesta si ves claramente que la media de la muestra está muy lejos en la otra dirección?
Otra cita de la misma página:
No es apropiado elegir una prueba de una cola después de ejecutar una prueba de dos colas que no pudo rechazar la hipótesis nula, no importa cuán "cercana" a significativa sea la prueba de dos colas.
Supongo que esto también se aplica al cambio de polaridad de su prueba de una cola. Pero, ¿cómo es este resultado "alterado" menos válido que si simplemente hubiera elegido la prueba de una cola correcta en primer lugar?
Claramente me estoy perdiendo una gran parte de la imagen aquí. Todo parece demasiado arbitrario. Lo que es, supongo, en el sentido de que lo que denota "estadísticamente significativo" - 95%, 99%, 99.9% ... es arbitrario para empezar.