Las pruebas que comparan distribuciones son pruebas de descarte. Comienzan con la hipótesis nula de que las 2 poblaciones son idénticas, luego intentan rechazar esa hipótesis. Nunca podemos probar que el nulo sea verdadero, simplemente rechazarlo, por lo que estas pruebas realmente no pueden usarse para mostrar que 2 muestras provienen de la misma población (o poblaciones idénticas).
Esto se debe a que podría haber diferencias menores en las distribuciones (lo que significa que no son idénticas), pero tan pequeñas que las pruebas realmente no pueden encontrar la diferencia.
Considere 2 distribuciones, la primera es uniforme de 0 a 1, la segunda es una mezcla de 2 uniformes, por lo que es 1 entre 0 y 0.999, y también 1 entre 9.999 y 10 (0 en otra parte). Claramente, estas distribuciones son diferentes (si la diferencia es significativa es otra pregunta), pero si toma un tamaño de muestra de 50 de cada (100 en total) hay más de un 90% de posibilidades de que solo vea valores entre 0 y 0.999 y ser incapaz de ver ninguna diferencia real
Hay formas de hacer lo que se llama prueba de equivalencia en la que pregunta si las 2 distribuciones / poblaciones son equivalentes, pero debe definir lo que considera equivalente. Generalmente es que alguna medida de diferencia está dentro de un rango dado, es decir, la diferencia en las 2 medias es inferior al 5% del promedio de las 2 medias, o el estadístico KS está por debajo de un límite dado, etc. Si usted luego puede calcular un intervalo de confianza para el estadístico de diferencia (la diferencia de medias podría ser simplemente el intervalo de confianza t, el arranque, la simulación u otros métodos pueden ser necesarios para otras estadísticas). Si todo el intervalo de confianza cae en la "región de equivalencia", consideramos que las 2 poblaciones / distribuciones son "equivalentes".
La parte difícil es descubrir cuál debería ser la región de equivalencia.