Eficiencia relativa del rango con signo de Wilcoxon en muestras pequeñas

He visto en la literatura publicada (y publicada aquí) que la eficiencia relativa asintótica de la prueba de rango con signo de Wilcoxon es de al menos 0,864 en comparación con la prueba t. También he oído que esto solo se aplica a muestras grandes, aunque algunos libros no mencionan esto (¿qué pasa con eso?).

De todos modos, mi pregunta es, ¿qué tan pequeñas deben ser las cosas antes de que el párrafo anterior ya no se aplique?

En mi caso tengo 4 pares de datos. Si se cumplen todos los supuestos, sé que tengo al menos un 90% de potencia para detectar un tamaño de efecto de 2SD bajo la prueba t emparejada si uso un alfa de 0.1 y tengo datos moderadamente correlacionados. Sin embargo, me gustaría usar la prueba de rango con signo de Wilcoxon debido al pequeño tamaño de la muestra y la imposibilidad de verificar las suposiciones, pero me preocupa que la prueba tenga muy poca potencia si lo hago. ¡Gracias!

— Jimj
fuente

Cualquier cosa "asintótica" en "muestras pequeñas" no tiene sentido: es una contradicción de términos. Sospecho que está preguntando por la eficacia relativa real en muestras pequeñas, punto. La respuesta depende de las distribuciones subyacentes que esté comparando, por lo que será complicado a menos que tenga en mente dos distribuciones específicas. Muchas personas eligen Normal como referencia, pero eso puede no ser necesariamente el adecuado para sus aplicaciones.

— whuber

Sí, estoy buscando eficiencia relativa en muestras pequeñas. Gracias por señalar eso. Quiero saber qué es lo peor que podría hacer con respecto al poder. Realmente no tengo ninguna distribución subyacente en mente, pero si tuviera que usar lo normal, como sugiere, ¿cómo procedería? Sé que también dependerá de qué tan correlacionados estén los datos.

— Jimj

¿Qué es "datos moderadamente correlacionados"?

— Glen_b -Reinstate a Monica el

Tenga en cuenta que su potencia superior al 90% estará en la normalidad, no en la distribución donde ARE es 0.864. Como tal, el cálculo debe hacerse a la normalidad.

— Glen_b -Reinstalar Monica

@ Glen_b: Tienes razón, debo especificar lo que estaba pensando por correlación moderada. Estaba pensando en una correlación de al menos 0,4. Entonces, ¿cómo haría el cálculo? TAMBIÉN, en términos de mi pregunta original sobre la comparación de la eficiencia de las dos pruebas en muestras pequeñas, investigué un poco sobre este tema. Un par de fuentes indicaron que la respuesta no está completamente clara en muestras más pequeñas, pero la prueba de Wilcoxon funciona razonablemente bien. Tal vez tendré que vivir con ese tipo de respuesta por ahora.

— Jimj

Klotz observó una pequeña potencia de muestra de la prueba de rango con signo en comparación con la muestra en el caso normal. $t$

[Klotz, J. (1963) "Muestra pequeña de potencia y eficiencia para las pruebas de Wilcoxon y puntajes normales de una muestra" The Annals of Mathematical Statistics , vol. 34, núm. 2, págs. 624-632]

En y cerca de (los s exactos no son alcanzables, por supuesto, a menos que siga la ruta de aleatorización, que la mayoría de las personas evita en uso, y creo que con razón) la eficiencia relativa de la en la normalidad tiende a estar bastante cerca del ARE allí (0.955), aunque cuán cerca depende (varía con el desplazamiento medio y en más pequeño , la eficiencia será menor). Con tamaños de muestra más pequeños que 10, la eficiencia es generalmente (un poco) mayor. $n=10$ $\alpha$ $0.1$ $\alpha$ $t$ $\alpha$

En y (ambos con cerca de 0,05), la eficiencia fue de alrededor de 0,97 o superior. $n=5$ $n=6$ $\alpha$

Entonces, en términos generales ... el ARE en la normalidad es una subestimación de la eficiencia relativa en el caso de muestra pequeña, siempre que no sea pequeño. Creo que para una prueba de dos colas con su más pequeño alcanzable es 0.125. En ese nivel de significancia y tamaño de muestra exactos, creo que la eficiencia relativa de la será similarmente alta (quizás aún alrededor de 0.97-0.98 o más) en el área donde el poder es interesante. $\alpha$ $n=4$ $\alpha$ $t$

Probablemente debería volver y hablar sobre cómo hacer una simulación, lo cual es relativamente sencillo.

Editar:

Acabo de hacer una simulación en el nivel 0.125 (porque es alcanzable en este tamaño de muestra); parece que, en un rango de diferencias en la media, la eficiencia típica es un poco menor, para , más alrededor de 0.95-0.97 más o menos, similar al valor asintótico. $n=4$

Actualizar

Aquí hay una gráfica de la potencia (2 lados) para la prueba t (calculada por power.t.test) en muestras normales, y la potencia simulada para la prueba de rango con signo de Wilcoxon: 40000 simulaciones por punto, con la prueba t como una variante de control. La incertidumbre en la posición de los puntos es inferior a un píxel:

curva de potencia para t y potencia para Wilcoxon

Para que esta respuesta sea más completa, debería analizar el comportamiento para el caso en el que ARE es en realidad 0.864 (la beta (2,2)).

— Glen_b -Reinstate a Monica
fuente