Debe usar la prueba de rango con signo cuando los datos están emparejados .
Encontrará muchas definiciones de emparejamiento, pero en el fondo el criterio es algo que hace que los pares de valores sean al menos algo positivamente dependientes, mientras que los valores no emparejados no son dependientes. A menudo, el emparejamiento de dependencia ocurre porque son observaciones en la misma unidad (medidas repetidas), pero no tiene que estar en la misma unidad, solo de alguna manera tiende a asociarse (mientras se mide el mismo tipo de cosas) , para ser considerado como 'emparejado'.
Debe usar la prueba de suma de rango cuando los datos no están emparejados.
Eso es básicamente todo lo que hay que hacer.
Tenga en cuenta que tener el mismo no significa que los datos estén emparejados, y tener un diferente no significa que no haya emparejamiento (puede ser que algunos pares hayan perdido una observación por alguna razón). El emparejamiento proviene de la consideración de lo que se muestreó.nortenorte
El efecto de usar una prueba emparejada cuando los datos están emparejados es que generalmente da más poder para detectar los cambios que le interesan. Si la asociación conduce a una fuerte dependencia *, entonces la ganancia en poder puede ser sustancial.
* específicamente, pero hablando de manera un tanto vaga, si el tamaño del efecto es grande en comparación con el tamaño típico de las diferencias de pares, pero pequeño en comparación con el tamaño típico de las diferencias no emparejadas, puede recoger la diferencia con una prueba emparejada en un tamaño de muestra bastante pequeño pero con una prueba no emparejada solo con un tamaño de muestra mucho mayor.
Sin embargo, cuando los datos no están emparejados, puede ser (al menos ligeramente) contraproducente tratar los datos como emparejados. Dicho esto, el costo - en potencia perdida - en muchas circunstancias puede ser bastante pequeño - un estudio de potencia que hice en respuesta a esta pregunta parece sugerir que, en promedio, la pérdida de potencia en situaciones típicas de pequeñas muestras (digamos para n del pedido de 10 a 30 en cada muestra, después de ajustar las diferencias en el nivel de significancia) puede ser sorprendentemente pequeño.
[Si de alguna manera no estás realmente seguro de si los datos están emparejados o no, la pérdida en el tratamiento de los datos no emparejados como emparejados suele ser relativamente menor, mientras que las ganancias pueden ser sustanciales si están emparejados. Esto sugiere que si realmente no lo sabe, y tiene una forma de averiguar qué está emparejado con qué suponer que estaban emparejados, como los valores que están en la misma fila en una tabla, en la práctica puede tener sentido actuar como si los datos estuvieran emparejados para ser seguros, aunque algunas personas pueden tender a ejercitarse bastante sobre que usted haga eso.]