¿Cómo elegir entre la prueba de signos y la prueba de rango con signo de Wilcoxon?

Estoy tratando de elegir una de estas dos pruebas para analizar datos emparejados. ¿Alguien sabe alguna regla general sobre cuál elegir en general?

— Sheldon
fuente

La respuesta de Silverfish allí solo (apenas) la toca. Esa pregunta es bastante general, me pregunto si podríamos tolerar una más específica.

— Glen_b: reinstala a Mónica el

Sheldon: la prueba de rango con signo supone una simetría de las diferencias que la prueba de signo no tiene. Por otro lado, si hay una simetría cercana y la cola no es muy pesada, el rango firmado debería tener más poder.

— Glen_b -Reinstala a Mónica el

Estoy de acuerdo. En mi caso, la prueba de suma de rango tiene el valor p más grande, la prueba de signo es el medio, el rango con signo es el más pequeño. Por lo tanto, tiene más poder.

— Sheldon

@Sheldon No, no es así como decide que una prueba tiene más potencia: un valor p más bajo con respecto a una muestra puede deberse simplemente a los caprichos de esa muestra, mientras que la potencia se trata del comportamiento en todas las muestras aleatorias extraídas de la misma población. Será mejor que escriba una respuesta que amplíe los comentarios anteriores, explique lo que significa tener más poder y explique algunas de las circunstancias bajo las cuales cada uno podría mejorar.

— Glen_b: reinstala a Mónica el

@Glen_b, diría que actualmente la consideración más importante es lo que será más útil para futuros lectores. Creo que quien busque la prueba de signos vs la prueba de Wilcoxon y encuentre este hilo, se beneficiará mucho más al leer su respuesta específica aquí que al ser redirigido a ese mega hilo donde es probable que se pierdan y nunca encuentren ninguna respuesta.

— ameba

Estoy tratando de elegir una de estas dos pruebas para analizar datos emparejados. ¿Alguien sabe alguna regla general sobre cuál elegir en general?

La prueba de rango con signo supone que la simetría de las diferencias es nula y que la prueba de signo no necesita. (Esa suposición es necesaria para que las permutaciones de los signos unidos a los rangos de diferencias sin signo sean igualmente probables).

Por otro lado, si hay una simetría cercana en la población y la cola no es muy pesada, el rango firmado debería tener más poder.

[Esto no debe tomarse como un consejo para elegir entre ellos en base a la muestra ; en general, esto conduce a propiedades de prueba diferentes a las nominales (las pruebas pueden estar sesgadas, los niveles de significancia reales ya no son lo que parecen ser, los valores p calculados no representan valores p verdaderos, etc.). En cambio, cuando sea posible, las características deben evaluarse en función del conocimiento externo a la muestra a la que se aplica la prueba, ya sea por conocimiento del área temática, familiaridad con otros conjuntos de datos como este, división de muestras, ...]

En mi caso, la prueba de suma de rango tiene el valor p más grande, la prueba de signo es el medio, el rango con signo es el más pequeño. Por lo tanto, tiene más poder.

No es así como decide que una prueba tiene más potencia: un valor p más bajo con respecto a una muestra puede deberse simplemente a los caprichos de esa muestra, mientras que la potencia se trata del comportamiento en todas las muestras aleatorias tomadas de la misma población.

$H_0$

De manera similar, podríamos calcular la tasa de rechazo para una secuencia de poblaciones con diferentes ubicaciones * de diferencias de pares y obtener una curva de potencia completa. Entonces, "potencia superior" correspondería a la curva de potencia completa (o casi toda, señalando que ambas deben estar en el mismo nivel de significancia) para una prueba que se encuentra por encima de la otra.

* podría tomarse como una mediana para la presente discusión, mientras que el estimador para la prueba de rango con signo es la mediana de los promedios por pares de las diferencias de pares, bajo el supuesto de simetría, el estimador de ubicación también debe ser una estimación adecuada del par medio diferencia.

Aquí hay una pregunta relacionada Cómo elegir entre la prueba t o la prueba no paramétrica, por ejemplo, Wilcoxon en muestras pequeñas . Una de las respuestas incluye una discusión (breve) del presente asunto.

— Glen_b -Reinstate a Monica
fuente

Gracias por tu aclaración. Creo que el mensaje más importante para llevar a casa es la suposición sobre la simetría de las diferencias para la prueba de rango con signo, que se viola en mi caso. Tengo la sensación de que, aparte de verificar si se cumplen los criterios de simetría, no hay forma de saber qué prueba es incorrecta. Más bien, suena razonable decir cuál es más apropiado.

— Sheldon

@Sheldon Si no está seguro de que las condiciones para la prueba sean casi verdaderas, generalmente no debe suponer que lo son. Es decir, quizás la prueba de signos sería una mejor idea. Espero agregar más información a mi respuesta cuando tenga la oportunidad.

— Glen_b -Reinstate Monica