Respuesta: Θ(mnlogn−−−−−√) .
Aplicando una versión multidimensional del Teorema del límite central, obtenemos que el vector tiene una distribución gaussiana asintóticamente multivariada con
y
Asumiremos a continuación que es un vector gaussiano (y no solo aproximadamente un vector gaussiano). Agreguemos una variable aleatoria gaussiana con varianza a todo ( es independiente de todo ). Es decir, deja
V a r [ X i ] = m ( 1(X1,…,Xn)Cov(Xi,Xj)=-m/n2. XZm/n2XiZXi( Y 1 Y 2 ⋮ Y n )=( X 1 +Z X 2 +Z⋮ X n +Z). (Y1
Var[Xi]=m(1n−1n2),
Cov(Xi,Xj)=−m/n2.
X Zm/n2XiZXi⎛⎝⎜⎜⎜⎜Y1Y2⋮Yn⎞⎠⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜X1+ZX2+Z⋮Xn+Z⎞⎠⎟⎟⎟⎟.
Obtenemos un vector gaussiano . Ahora cada tiene varianza :
y todos son independientes:
Y i m / n V a r [ Y i ] = V a r [ X i ] + 2 C o v ( X i , Z ) ⏟ =(Y1,…,Yn)Yim/nVar[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
YiCov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.
Tenga en cuenta que . Por lo tanto, nuestro problema original es equivalente al problema de encontrar . Primero, para simplificar, analicemos el caso cuando todos tienen varianza .Yi−Yj=Xi−XjYmax−Ysec−maxYi1
Problema. Se nos da gaussiano independiente rv con media y varianza . Estime la expectativa de .nγ1,…,γnμ1γmax−γsec−max
Respuesta: .Θ(1logn√)
Prueba informal
Aquí hay una solución informal a este problema (no es difícil hacerlo formal). Como la respuesta no depende de la media, suponemos que . Deje , donde . Tenemos (para moderadamente grande ),
μ=0Φ¯(t)=Pr[γ>t]γ∼N(0,1)t
Φ¯(t)≈12π−−√te−12t2.
Tenga en cuenta que
Φ(γi) se distribuyen de manera uniforme e independiente en ,[0,1]
Φ(γmax) es el más pequeño entre ,Φ(γi)
Φ(γsec−max) es el segundo más pequeño entre .Φ(γi)
Por lo tanto está cerca de y está cerca de (no hay concentración pero si nosotros no' No importa las constantes, estas estimaciones son lo suficientemente buenas; de hecho, incluso son bastante buenas si nos preocupamos por las constantes, pero eso necesita una justificación). Usando la fórmula para , obtenemos que
Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)
2≈Φ¯(γsec−max)/Φ¯(γmax)≈e12(γ2max−γ2sec−max).
Así es whp Tenga en cuenta que . Tenemos,
γ2max−γ2sec−maxΘ(1)γmax≈γsec−max=Θ(logn−−−−√)
γmax−γsec−max≈Θ(1)γmax+γsec−max≈Θ(1)logn−−−−√.
QED
Obtenemos que
E[Xmax−Xsec−max]=E[Ymax−Ysec−max]=Var[Yi]−−−−−−√×E[γmax−γsec−max]=Θ(mnlogn−−−−−−√).
El mismo argumento pasa cuando tenemos puntajes arbitrarios. Muestra que
E[Xmax−Xsec−max]=cE[Xmax−Xmin]/logn.