Supongamos que tengo tres grupos independientes, con media respectivamente.
¿Cómo puedo probar si o no muestras de cada grupo?
Deseo conocer alguna metodología general, no un cálculo detallado. No pude entender cómo establecer mi hipótesis y .
Supongamos que tengo tres grupos independientes, con media respectivamente.
¿Cómo puedo probar si o no muestras de cada grupo?
Deseo conocer alguna metodología general, no un cálculo detallado. No pude entender cómo establecer mi hipótesis y .
Respuestas:
En las estadísticas no puede probar si "X es verdadero o no". Solo puede intentar encontrar evidencia de que una hipótesis nula es falsa.
Digamos que su hipótesis nula es
Supongamos también que tiene una forma de estimar el vector . Para mantener las cosas, simplemente asuma que tiene un estimador
donde es matriz covariable . Podemos reescribir la hipótesis nula como
donde
Esto muestra que su hipótesis nula puede expresarse como una restricción de desigualdad en el vector . Un estimador natural de viene dado por
Kudo, Akio (1963). "Un análogo multivariante de la prueba unilateral". En: Biometrika 50.3 / 4, págs. 403–418.
Esta prueba también funcionará si el supuesto de normalidad se mantiene solo aproximadamente ("asintóticamente"). Por ejemplo, funcionará si puede extraer medias de muestra de los grupos. Si dibuja muestras de tamaño y puede dibujar independientemente de los grupos, entonces es una matriz diagonal con diagonal
donde es la varianza en el grupo . En una aplicación, puede usar la varianza de la muestra en lugar de la varianza de la población desconocida sin cambiar las propiedades de la prueba.
Si, por otro lado, su hipótesis alternativa es
entonces su hipótesis nula se convierte en
Esto no es muy operativo. Recuerde que nuestra nueva hipótesis alternativa se puede escribir como para que
No sé si existe alguna prueba especializada para esto, pero definitivamente puedes probar alguna estrategia basada en pruebas sucesivas. Recuerda que tratas de encontrar evidencia contra el nulo. Entonces, primero puede probar
y luego
Si rechaza ambas veces entonces has encontrado evidencia de que
Otra forma de construir una prueba para es notar que
Esto implica el uso de como estadística de prueba. La prueba tendrá una distribución no estándar debajo de la nula, pero el valor crítico apropiado aún debería ser bastante fácil de calcular.
La respuesta proporcionada por @ andreas-dzemski es correcta solo si sabemos que los datos se distribuyen normalmente.
Si no conocemos la distribución, creo que sería mejor ejecutar una prueba no paramétrica. En este caso, el más simple parece ejecutar una prueba de permutación. Este es un libro sobre el tema y esta es una buena explicación en línea. A continuación incluyo el código R para calcular esta prueba.
# some test data
D <- data.frame(group1=c(3,6,2,2,3,9,3,4,2,5), group2=c(5,3,10,1,10,2,4,4,2,2), group3=c(8,0,1,5,10,7,3,4,8,1))
# sample with replacement
resample <- function(X) sample(X, replace=TRUE)
# return true if mu1 < mu2 < mu3
test <- function(mu1, mu2, mu3) (mu1 < mu2) & (mu2 < mu3)
# resampling test that returns the probability of observing the relationship
mean(replicate(1000, test(mean(resample(D$group1)), mean(resample(D$group2)), mean(resample(D$group3)))))