He hurgado un poco en los archivos de Cross Validated y parece que no he encontrado una respuesta a mi pregunta. Mi pregunta es la siguiente: Wikipedia da tres supuestos que deben cumplirse para la prueba de rango con signo de Wilcoxon (ligeramente modificada para mis preguntas):
Deje Zi = Xi-Yi para i = 1, ..., n.
Se supone que las diferencias Zi son independientes.
(a.) Cada Zi proviene de la misma población continua, y (b.) cada Zi es simétrico respecto a una mediana común;
Los valores que representan Xi e Yi están ordenados ... por lo que las comparaciones 'mayor que', 'menor que' e 'igual a' son útiles.
Sin embargo, la documentación de? Wilcox.test en R parece indicar que (2.b) es realmente algo que se prueba mediante el procedimiento:
"... si se dan x e y emparejados es VERDADERO, se realiza una prueba de rango con signo de Wilcoxon de la nulidad de que la distribución ... de x - y (en el caso de dos muestras emparejadas) es simétrica acerca de mu".
Esto suena a mí como si la prueba se realiza para la hipótesis nula de que "Z se distribuye simétricamente alrededor mu mediana = SomeMu" - de tal manera que el rechazo de la fo nula podría ser o bien un rechazo de la simetría o un rechazo que las mu torno a los cuales Z es simétrica es SomeMu.
¿Es esto una comprensión correcta de la documentación de R para wilcox.test? La razón por la que esto es importante, por supuesto, es que estoy llevando a cabo una serie de pruebas de diferencia pareada en algunos datos de antes y después ("X" e "Y" arriba). Los datos "antes" y "después" de forma individual están muy sesgados, pero las diferencias no son tan sesgadas (aunque sí algo sesgadas). Con eso quiero decir que los datos "antes" o "después" considerados solos tienen asimetría ~ 7 a 21 (dependiendo de la muestra que estoy viendo), mientras que los datos de "diferencias" tienen asimetría ~ = 0.5 a 5. Aún sesgada, pero no tanto
Si tener sesgo en mis datos de "diferencias" hará que la prueba de Wilcoxon me dé resultados falsos / sesgados (como parece indicar el artículo de Wikipedia), entonces el sesgo podría ser una gran preocupación. Sin embargo, si las pruebas de Wilcoxon realmente prueban si la distribución de las diferencias es "simétrica alrededor de mu = SomeMu" (como parece indicar? Wilcox.test), entonces esto no es motivo de preocupación.
Por lo tanto, mis preguntas son:
¿Qué interpretación anterior es correcta? ¿La asimetría en mi distribución de "diferencias" va a sesgar mi prueba de Wilcoxon?
Si la asimetría es una preocupación: "¿Qué tanta asimetría es una preocupación?"
Si las pruebas de rango con signo de Wilcoxon parecen muy inapropiadas aquí, ¿alguna sugerencia de lo que debo usar?
Muchas gracias. Si tiene más sugerencias sobre cómo podría hacer este análisis, estoy más que feliz de escucharlas (aunque también puedo abrir otro hilo para ese propósito). Además, esta es mi primera pregunta sobre Cross Validated; Si tiene sugerencias / comentarios sobre cómo hice esta pregunta, ¡estoy abierto a eso también!
Un poco de historia: estoy analizando un conjunto de datos que contiene observaciones sobre lo que llamaré "errores en la producción de la empresa". Tengo una observación sobre los errores que ocurren en el proceso de producción antes y después de una inspección sorpresa, y uno de los objetivos del análisis es responder a la pregunta, "¿la inspección hace una diferencia en la cantidad de errores observados?"
El conjunto de datos se parece a esto:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Hay aproximadamente 4000 observaciones. Las otras variables son observaciones catagóricas que describen las características de las empresas. El tamaño puede ser pequeño, mediano o grande, y cada empresa es una y solo una de ellas. Las empresas pueden ser cualquiera o todos los "tipos".
Se me pidió que realizara algunas pruebas simples para ver si había diferencias estadísticamente significativas en las tasas de error observadas antes y después de las inspecciones para todas las empresas y varios subgrupos (según el tamaño y el tipo). Las pruebas T estaban fuera porque los datos estaban muy sesgados tanto antes como después, por ejemplo, en R los datos anteriores se veían así:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Estos están inventados, me temo que no puedo publicar los datos reales o cualquier manipulación real de los mismos debido a problemas de propiedad / privacidad, ¡disculpas!)
Las diferencias pareadas estaban más centralizadas pero aún no muy bien ajustadas por una distribución normal, demasiado alta. Los datos de diferencias se parecen a esto:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Se sugirió que usara una prueba de rango con signo de Wilcoxon, y después de una breve persuasión de? Wilcox.test y Wikipedia, y aquí, esta parece ser la prueba a usar. Teniendo en cuenta los supuestos anteriores, creo que (1) está bien dado el proceso de generación de datos. La suposición (2.a) no es estrictamente cierta para mis datos, pero la discusión aquí: ¿ Alternativa a la prueba de Wilcoxon cuando la distribución no es continua? parecía indicar que esto no era una gran preocupación. La suposición (3) está bien. Mi única preocupación (creo) es la Asunción (2.b).
Una nota adicional , algunos años después: finalmente tomé un excelente curso de estadísticas no paramétricas y pasé mucho tiempo en las pruebas de suma de rango. Incrustado en el supuesto (2.a), "Cada Zi proviene de la misma población continua", está la idea de que ambas muestras provienen de poblaciones con la misma varianza ; esto resulta ser extremadamente importante, prácticamente hablando. Si tiene inquietudes sobre las diferentes variaciones en sus poblaciones (de las cuales extrae las muestras), debe preocuparse por usar WMW.