El valor P se define como la probabilidad de obtener una estadística de prueba al menos tan extrema como la observada, suponiendo que la hipótesis nula sea verdadera. En otras palabras,
¿Pero qué pasa si el estadístico de prueba es bimodal en distribución? ¿El valor p significa algo en este contexto? Por ejemplo, voy a simular algunos datos bimodales en R:
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
Y supongamos que observamos un valor estadístico de prueba de 60. Y aquí sabemos por la imagen que este valor es muy poco probable . Entonces, idealmente, me gustaría un procedimiento estadístico que use (digamos, valor p) para revelar esto. Pero si calculamos el valor p como se define, obtenemos un valor p bastante alto
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
Si no supiera la distribución, concluiría que lo que observé es simplemente por casualidad. Pero sabemos que esto no es cierto.
Creo que la pregunta que tengo es: ¿Por qué, al calcular el valor p, calculamos la probabilidad de los valores "al menos tan extremos como" los observados? Y si encuentro una situación como la que simulé anteriormente, ¿cuál es la solución alternativa?