Ok, aquí está mi primer intento. ¡Un escrutinio cercano y comentarios apreciados!
Las hipótesis de dos muestras
Si podemos enmarcar las pruebas de hipótesis de Kolmogorov-Smirnov unilaterales de dos muestras , con hipótesis nulas y alternativas a lo largo de estas líneas:
H 0 : F Y ( t ) ≥ F X ( t ) , y0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , para al menos una t , donde:A: FY(t)<FX(t)t
D−=|mint(FY(t)−FX(t))|0: FY(t)≥FX(t)
la estadística de prueba corresponde a H ; yD+=|maxt(FY(t)−FX(t))|0: FY(t)≤FX(t)
F X ( t ) Y XFY(t) y son los CDF empíricos de las muestras y ,FX(t)YX
entonces debería ser razonable crear una hipótesis de intervalo general para una prueba de equivalencia a lo largo de estas líneas (suponiendo que el intervalo de equivalencia sea simétrico por el momento):
H , y−0: |FY(t)−FX(t)|≥Δ
H , para al menos una .t−A: |FY(t)−FX(t)|<Δt
Esto se traduciría en las dos hipótesis nulas "negativistas" unilaterales específicas para probar la equivalencia (estas dos hipótesis toman la misma forma, ya que tanto como son estrictamente no negativas): D -D+D−
H , o−01: D+≥Δ
H .−02: D−≥Δ
Rechazando tanto H y H llevaría a concluir que . Por supuesto, el intervalo de equivalencia no necesita ser simétrico, y y podrían reemplazarse con (inferior) y (superior) para las respectivas hipótesis nulas unilaterales.- 02 -Δ<FY(t)-FX(t)<Δ-ΔΔΔ2Δ1−01 −02−Δ<FY(t)−FX(t)<Δ−ΔΔΔ2Δ1
Las estadísticas de prueba (Actualizado: Delta está fuera del signo de valor absoluto)
Las estadísticas de prueba y (dejando implícitos y ) corresponden a H y H , respectivamente, y son: D - 2 n Y n X - 01 - 02D+1D−2nYnX−01−02
D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|y
D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|
El umbral de equivalencia / relevancia
El intervalo —o , si se usa un intervalo de equivalencia asimétrica — se expresa en unidades de y , o la magnitud de las probabilidades diferenciadas. A medida que y acercan al infinito, el CDF de o para acerca a para , y para :[−Δ,Δ][Δ2,Δ1]D+D−nYnXD+D−nY,nX0t<0t≥0
limnY,nX→∞p+=P(nYnXnY+nX−−−−−−−−√D+≤t)=1−e−2t2
Por lo tanto, me parece que el PDF para con escala de tamaño de muestra (o con escala de tamaño de muestra ) debe ser para y para :D+D−0t<0t≥0
f(t)=1−e−2t2ddt=4te−2t2
Glen_b señala que esta es una distribución de Rayleigh con . Entonces, la función de cuantiles de muestra grande para y escala de tamaño de muestra es:σ=12D+D−
CDF−1=Q(p)=−ln(1−p)2−−−−−−−−−−√
y una elección liberal de podría ser el valor crítico , y una elección más estricta es el valor crítico .ΔQα+σ/2=Qα+14Qα+σ/4=Qα+18