Estoy tratando de elegir una de estas dos pruebas para analizar datos emparejados. ¿Alguien sabe alguna regla general sobre cuál elegir en general?
Estoy tratando de elegir una de estas dos pruebas para analizar datos emparejados. ¿Alguien sabe alguna regla general sobre cuál elegir en general?
Respuestas:
Estoy tratando de elegir una de estas dos pruebas para analizar datos emparejados. ¿Alguien sabe alguna regla general sobre cuál elegir en general?
La prueba de rango con signo supone que la simetría de las diferencias es nula y que la prueba de signo no necesita. (Esa suposición es necesaria para que las permutaciones de los signos unidos a los rangos de diferencias sin signo sean igualmente probables).
Por otro lado, si hay una simetría cercana en la población y la cola no es muy pesada, el rango firmado debería tener más poder.
[Esto no debe tomarse como un consejo para elegir entre ellos en base a la muestra ; en general, esto conduce a propiedades de prueba diferentes a las nominales (las pruebas pueden estar sesgadas, los niveles de significancia reales ya no son lo que parecen ser, los valores p calculados no representan valores p verdaderos, etc.). En cambio, cuando sea posible, las características deben evaluarse en función del conocimiento externo a la muestra a la que se aplica la prueba, ya sea por conocimiento del área temática, familiaridad con otros conjuntos de datos como este, división de muestras, ...]
En mi caso, la prueba de suma de rango tiene el valor p más grande, la prueba de signo es el medio, el rango con signo es el más pequeño. Por lo tanto, tiene más poder.
No es así como decide que una prueba tiene más potencia: un valor p más bajo con respecto a una muestra puede deberse simplemente a los caprichos de esa muestra, mientras que la potencia se trata del comportamiento en todas las muestras aleatorias tomadas de la misma población.
De manera similar, podríamos calcular la tasa de rechazo para una secuencia de poblaciones con diferentes ubicaciones * de diferencias de pares y obtener una curva de potencia completa. Entonces, "potencia superior" correspondería a la curva de potencia completa (o casi toda, señalando que ambas deben estar en el mismo nivel de significancia) para una prueba que se encuentra por encima de la otra.
* podría tomarse como una mediana para la presente discusión, mientras que el estimador para la prueba de rango con signo es la mediana de los promedios por pares de las diferencias de pares, bajo el supuesto de simetría, el estimador de ubicación también debe ser una estimación adecuada del par medio diferencia.
Aquí hay una pregunta relacionada Cómo elegir entre la prueba t o la prueba no paramétrica, por ejemplo, Wilcoxon en muestras pequeñas . Una de las respuestas incluye una discusión (breve) del presente asunto.