Mientras leo el libro All of Statistics de Wassermann, noto una fina sutileza en la definición de los valores p, que no puedo entender. Informalmente, Wassermann define el valor p como
[..] la probabilidad (bajo ) de observar un valor del estadístico de prueba igual o más extremo de lo que realmente se observó.
Énfasis añadido. Lo mismo más formalmente (Teorema 10.12):
Suponga que la prueba de tamaño tiene la forma
rechazar si y solo si .
Entonces,
donde es el valor observado de . Si entonces
Además, Wassermann define el valor p de la prueba \ chi ^ 2 de Pearson (y otras pruebas de forma análoga) como:
La parte que me gustaría pedir aclaraciones es el signo mayor-igual ( ) en el primer signo y el signo mayor ( ) en la segunda definición. ¿Por qué no escribimos , que coincidiría con la primera cita de " igual o más extremo"?
¿Es pura conveniencia para que calculemos el valor p como ? Noté que R también usa la definición con el signo , por ejemplo, en .chisq.test