Idoneidad de la prueba de rango con signo de Wilcoxon

11

He hurgado un poco en los archivos de Cross Validated y parece que no he encontrado una respuesta a mi pregunta. Mi pregunta es la siguiente: Wikipedia da tres supuestos que deben cumplirse para la prueba de rango con signo de Wilcoxon (ligeramente modificada para mis preguntas):

Deje Zi = Xi-Yi para i = 1, ..., n.

Se supone que las diferencias Zi son independientes.
(a.) Cada Zi proviene de la misma población continua, y (b.) cada Zi es simétrico respecto a una mediana común;
Los valores que representan Xi e Yi están ordenados ... por lo que las comparaciones 'mayor que', 'menor que' e 'igual a' son útiles.

Sin embargo, la documentación de? Wilcox.test en R parece indicar que (2.b) es realmente algo que se prueba mediante el procedimiento:

"... si se dan x e y emparejados es VERDADERO, se realiza una prueba de rango con signo de Wilcoxon de la nulidad de que la distribución ... de x - y (en el caso de dos muestras emparejadas) es simétrica acerca de mu".

Esto suena a mí como si la prueba se realiza para la hipótesis nula de que "Z se distribuye simétricamente alrededor mu mediana = SomeMu" - de tal manera que el rechazo de la fo nula podría ser o bien un rechazo de la simetría o un rechazo que las mu torno a los cuales Z es simétrica es SomeMu.

¿Es esto una comprensión correcta de la documentación de R para wilcox.test? La razón por la que esto es importante, por supuesto, es que estoy llevando a cabo una serie de pruebas de diferencia pareada en algunos datos de antes y después ("X" e "Y" arriba). Los datos "antes" y "después" de forma individual están muy sesgados, pero las diferencias no son tan sesgadas (aunque sí algo sesgadas). Con eso quiero decir que los datos "antes" o "después" considerados solos tienen asimetría ~ 7 a 21 (dependiendo de la muestra que estoy viendo), mientras que los datos de "diferencias" tienen asimetría ~ = 0.5 a 5. Aún sesgada, pero no tanto

Si tener sesgo en mis datos de "diferencias" hará que la prueba de Wilcoxon me dé resultados falsos / sesgados (como parece indicar el artículo de Wikipedia), entonces el sesgo podría ser una gran preocupación. Sin embargo, si las pruebas de Wilcoxon realmente prueban si la distribución de las diferencias es "simétrica alrededor de mu = SomeMu" (como parece indicar? Wilcox.test), entonces esto no es motivo de preocupación.

Por lo tanto, mis preguntas son:

¿Qué interpretación anterior es correcta? ¿La asimetría en mi distribución de "diferencias" va a sesgar mi prueba de Wilcoxon?
Si la asimetría es una preocupación: "¿Qué tanta asimetría es una preocupación?"
Si las pruebas de rango con signo de Wilcoxon parecen muy inapropiadas aquí, ¿alguna sugerencia de lo que debo usar?

Muchas gracias. Si tiene más sugerencias sobre cómo podría hacer este análisis, estoy más que feliz de escucharlas (aunque también puedo abrir otro hilo para ese propósito). Además, esta es mi primera pregunta sobre Cross Validated; Si tiene sugerencias / comentarios sobre cómo hice esta pregunta, ¡estoy abierto a eso también!

Un poco de historia: estoy analizando un conjunto de datos que contiene observaciones sobre lo que llamaré "errores en la producción de la empresa". Tengo una observación sobre los errores que ocurren en el proceso de producción antes y después de una inspección sorpresa, y uno de los objetivos del análisis es responder a la pregunta, "¿la inspección hace una diferencia en la cantidad de errores observados?"

El conjunto de datos se parece a esto:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

Hay aproximadamente 4000 observaciones. Las otras variables son observaciones catagóricas que describen las características de las empresas. El tamaño puede ser pequeño, mediano o grande, y cada empresa es una y solo una de ellas. Las empresas pueden ser cualquiera o todos los "tipos".

Se me pidió que realizara algunas pruebas simples para ver si había diferencias estadísticamente significativas en las tasas de error observadas antes y después de las inspecciones para todas las empresas y varios subgrupos (según el tamaño y el tipo). Las pruebas T estaban fuera porque los datos estaban muy sesgados tanto antes como después, por ejemplo, en R los datos anteriores se veían así:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(Estos están inventados, me temo que no puedo publicar los datos reales o cualquier manipulación real de los mismos debido a problemas de propiedad / privacidad, ¡disculpas!)

Las diferencias pareadas estaban más centralizadas pero aún no muy bien ajustadas por una distribución normal, demasiado alta. Los datos de diferencias se parecen a esto:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

Se sugirió que usara una prueba de rango con signo de Wilcoxon, y después de una breve persuasión de? Wilcox.test y Wikipedia, y aquí, esta parece ser la prueba a usar. Teniendo en cuenta los supuestos anteriores, creo que (1) está bien dado el proceso de generación de datos. La suposición (2.a) no es estrictamente cierta para mis datos, pero la discusión aquí: ¿ Alternativa a la prueba de Wilcoxon cuando la distribución no es continua? parecía indicar que esto no era una gran preocupación. La suposición (3) está bien. Mi única preocupación (creo) es la Asunción (2.b).

Una nota adicional , algunos años después: finalmente tomé un excelente curso de estadísticas no paramétricas y pasé mucho tiempo en las pruebas de suma de rango. Incrustado en el supuesto (2.a), "Cada Zi proviene de la misma población continua", está la idea de que ambas muestras provienen de poblaciones con la misma varianza ; esto resulta ser extremadamente importante, prácticamente hablando. Si tiene inquietudes sobre las diferentes variaciones en sus poblaciones (de las cuales extrae las muestras), debe preocuparse por usar WMW.

r hypothesis-testing

— CompEcon
fuente

Gracias por las dos respuestas! Ambos me ayudaron bastante por igual. Hubiera "elegido los dos" si pudiera. Mike me señaló algo de la comprensión teórica, que fue muy útil conceptualmente, a pesar de que Aniko respondía un poco más directamente a mi pregunta original. ¡Gracias a los dos!

— CompEcon

8

Wikipedia lo ha engañado al decir "... si tanto x como y son dados y emparejados es VERDADERO, una prueba de rango con signo de Wilcoxon de la nula que la distribución ... de x - y (en el caso de dos muestras emparejadas) es simétrica sobre mu se realiza ".

La prueba determina si los valores TRANSFORMADOS RANGO de son simétricos alrededor de la mediana que especifique en su hipótesis nula (supongo que usaría cero). La inclinación no es un problema, ya que la prueba de rango con signo, como la mayoría de las pruebas no paramétricas, es "libre de distribución". El precio que paga por estas pruebas a menudo es potencia reducida, pero parece que tiene una muestra lo suficientemente grande como para superar eso. $z_i = x_i - y_i$

Una alternativa de "qué demonios" a la prueba de suma de rango podría ser probar una transformación simple como y en caso de que estas mediciones puedan seguir aproximadamente una distribución lognormal, por lo que los valores deben verse "campana curvilínea". Luego, podría usarlo en la prueba y convencerse a sí mismo (y a su jefe que solo tomó estadísticas comerciales) de que la prueba de suma de rango está funcionando. Si esto funciona, hay una ventaja: la prueba t de los medios para datos lognormales es una comparación de medianas para las mediciones originales, no transformadas. $\ln(x_i)$ $\ln(y_i)$

¿Yo? Haría ambas cosas, y cualquier otra cosa que pudiera preparar (¿prueba de razón de probabilidad en los recuentos de Poisson por tamaño de la empresa?). La prueba de hipótesis se trata de determinar si la evidencia es convincente, y algunas personas se convencen.

— Mike Anderson
fuente

Ah, eso tiene mucho sentido. Especialmente ahora que llegué a casa y saqué mi viejo libro de texto DeGroot & Schervish, que tiene una buena descripción de lo que están haciendo estas pruebas de signos. Fantástico. Y gracias por los pensamientos generales sobre la prueba de hipótesis :) Me gusta la perspectiva. Una nota menor: la porción que notas como engañosa es en realidad de R, de la documentación de wilcox.test. Esto es un poco inquietante para mí ...

— CompEcon

9

Tanto Wikipedia como la página de ayuda de R son correctas e intentan decir lo mismo, simplemente lo expresan de manera diferente.

El artículo de Wikipedia establece las hipótesis como (mediana = 0) vs (¡mediana! = 0), y dice que puede concluir esto a partir de la prueba si las diferencias tienen una distribución simétrica (+ los otros supuestos).

La página de ayuda de R es más específica, establece las hipótesis como (mediana = 0 y las diferencias tienen una distribución simétrica) vs (al menos una de ellas es falsa). Por lo tanto, movió una suposición a la hipótesis nula. Creo que han hecho esto para enfatizar la necesidad de simétrica: con diferencias asimétricas, la prueba de rango con signo rechazará la hipótesis nula, incluso si la mediana es acertada. Si lee un libro de texto, también podría decirle que la hipótesis nula que se está probando es P (X> Y) = 0.5; el resto, de hecho, se sigue de esto.

En términos de aplicación, la pregunta es, por supuesto, si le importa específicamente la mediana (y luego la asimetría es un problema, y la prueba de la mediana es una posible alternativa), o si le importa la distribución completa, y luego P (X> y)! = 0.5 es evidencia de cambios.

— Aniko
fuente

1

Ok, esto tiene sentido. ¡Gracias por el aporte! Noté que la página de Wikipedia para la prueba mediana dice que se prefiere la prueba de Mann-Whitney-U no emparejada. Esto inmediatamente me hace pensar que estoy de vuelta donde comencé, pensando que la prueba de Wilcoxon emparejada de alguna manera usa más información. Quizás lo que realmente estoy tratando de pensar es a qué te refieres cuando dices "preocuparse específicamente por la mediana ... o por la distribución completa". Me importa toda la distribución, pero la estoy caracterizando a través de la mediana ...

— CompEcon