Análisis de bolas y contenedores en el régimen


23

mnmnXiiXmaxXminXsecmaxXiXjN(0,2m/n)|XiXj|=Θ(m/n) i,jXmaxXmin=O(mlogn/n)n/2 pares de contenedores separados. Este argumento (no completamente formal) nos lleva a esperar que la brecha entre Xmax y Xmin sea Θ(mlogn/n) con alta probabilidad.

Estoy interesado en la brecha entre Xmax y Xsecmax . El argumento descrito anteriormente muestra que XmaxXsecmax=O(mlogn/n) con alta probabilidad, pero el factor logn parece extraño . ¿Se sabe algo sobre la distribución de XmaxXsecmax ?

En términos más generales, suponga que cada bola está asociada con un puntaje no negativo para cada bin, y estamos interesados ​​en el puntaje total de cada bin después de lanzar m bolas. El escenario habitual corresponde a las puntuaciones de la forma (0,,0,1,0,,0) . Suponga que la distribución de probabilidad de los puntajes es invariable bajo la permutación de los contenedores (en el escenario habitual, esto corresponde al hecho de que todos los contenedores son equiprobables). Dada la distribución de los puntajes, podemos usar el método del primer párrafo para obtener un buen límite en XmaxXmin . El límite contendrá un factor de lognque proviene de un enlace de unión (a través de las probabilidades de cola de una variable normal). ¿Se puede reducir este factor si estamos interesados ​​en limitar XmaxXsecmax ?


Cada puntaje está en [0,1]?
Neal Young el

Realmente no importa, siempre puedes escalarlo para que esté en [0,1] .
Yuval Filmus

Respuestas:


21

Respuesta: Θ(mnlogn) .

Aplicando una versión multidimensional del Teorema del límite central, obtenemos que el vector tiene una distribución gaussiana asintóticamente multivariada con y Asumiremos a continuación que es un vector gaussiano (y no solo aproximadamente un vector gaussiano). Agreguemos una variable aleatoria gaussiana con varianza a todo ( es independiente de todo ). Es decir, deja V a r [ X i ] = m ( 1(X1,,Xn)Cov(Xi,Xj)=-m/n2. XZm/n2XiZXi( Y 1 Y 2 Y n )=( X 1 +Z X 2 +Z X n +Z). (Y1

Var[Xi]=m(1n1n2),
Cov(Xi,Xj)=m/n2.
X Zm/n2XiZXi
(Y1Y2Yn)=(X1+ZX2+ZXn+Z).
Obtenemos un vector gaussiano . Ahora cada tiene varianza : y todos son independientes: Y i m / n V a r [ Y i ] = V a r [ X i ] + 2 C o v ( X i , Z ) =(Y1,,Yn)Yim/n
Var[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
Yi
Cov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.

Tenga en cuenta que . Por lo tanto, nuestro problema original es equivalente al problema de encontrar . Primero, para simplificar, analicemos el caso cuando todos tienen varianza .YiYj=XiXjYmaxYsecmaxYi1

Problema. Se nos da gaussiano independiente rv con media y varianza . Estime la expectativa de .nγ1,,γnμ1γmaxγsecmax

Respuesta: .Θ(1logn)

Prueba informal Aquí hay una solución informal a este problema (no es difícil hacerlo formal). Como la respuesta no depende de la media, suponemos que . Deje , donde . Tenemos (para moderadamente grande ), μ=0Φ¯(t)=Pr[γ>t]γN(0,1)t

Φ¯(t)12πte12t2.

Tenga en cuenta que

  • Φ(γi) se distribuyen de manera uniforme e independiente en ,[0,1]

  • Φ(γmax) es el más pequeño entre ,Φ(γi)

  • Φ(γsecmax) es el segundo más pequeño entre .Φ(γi)

Por lo tanto está cerca de y está cerca de (no hay concentración pero si nosotros no' No importa las constantes, estas estimaciones son lo suficientemente buenas; de hecho, incluso son bastante buenas si nos preocupamos por las constantes, pero eso necesita una justificación). Usando la fórmula para , obtenemos que Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)

2Φ¯(γsecmax)/Φ¯(γmax)e12(γmax2γsecmax2).

Así es whp Tenga en cuenta que . Tenemos, γmax2γsecmax2Θ(1)γmaxγsecmax=Θ(logn)

γmaxγsecmaxΘ(1)γmax+γsecmaxΘ(1)logn.

QED

Obtenemos que

E[XmaxXsecmax]=E[YmaxYsecmax]=Var[Yi]×E[γmaxγsecmax]=Θ(mnlogn).

El mismo argumento pasa cuando tenemos puntajes arbitrarios. Muestra que

E[XmaxXsecmax]=cE[XmaxXmin]/logn.

2
¡Gracias! Recordaré probar la aproximación gaussiana multivariante la próxima vez.
Yuval Filmus

55
Yury, usted escribió "Agreguemos un vector gaussiano con varianza a todo . Obtenemos un vector gaussiano . Ahora cada tiene varianza todos no son correlacionado ... Tenga en cuenta que ". ¿Se puede ampliar en esta parte? ¿Es ? Si las son dependientes y las son independientes (o uniformemente iguales), ¿cómo pueden ser independientes las ? (Parece un buen truco, pero no lo entiendo). Gracias. m /Zm/n2Xi(Y1,,Yn)Yim/nYiYiYj=XiXjZi=ZjXiZiYi
Neal Young

1
@NealYoung, sí, si tenemos variables con correlación negativa en pares y todas las covarianzas son iguales , entonces podemos agregar una única variable aleatoria nueva a todas las modo que Las sumas son independientes. Además, si las variables tienen correlación positiva y nuevamente todas las covarianzas son iguales, entonces podemos restar un solo rv de todas ellas para que todas las diferencias sean independientes; pero ahora no es independiente de sinoX1,,XnCov(Xi,Xj)ZXiCov(Xi,Xj)ZZXiZ=α(X1++Xn)para algunos parámetros de escala . α
Yury

1
Ah, ya veo. al menos algebraicamente, todo en lo que descansa es la independencia por pares de Z y cada . muy genial. Xi
Suresh Venkat

1
Este argumento aparece ahora (con atribución) en un documento de EC'14 : dl.acm.org/citation.cfm?id=2602829 .
Yuval Filmus

13

Para su primera pregunta, creo que puede mostrar que whp es Tenga en cuenta que esto es .XmaxXsec-max

o(mnlog2lognlogn).
o(m/n)

Compare su experimento aleatorio con la siguiente alternativa: Sea la carga máxima de cualquiera de los primeros cubos. Deje que sea ​​la carga máxima de cualquiera de los últimos cubos.X1n/2X2n/2

En consideración,es un límite superior en . Además, con probabilidad de al menos la mitad, . Entonces, hablando en términos generales, se distribuye de manera similar a.|X1X2|XmaxXsecmax|X1X2|=XmaxXsecmaxXmaxXsecmax|X1X2|

Para estudiar, tenga en cuenta que con alta probabilidad se lanzan bolas en los primeros contenedores, y del mismo modo para los últimos contenedores. Entonces, y se distribuyen esencialmente como la carga máxima cuando se lanzan bolas en contenedores.|X1X2|m/2±O(m)n/2n/2X1X2m=m/2±o(m)n=n/2

Esta distribución está bien estudiada y, afortunadamente para este argumento, está fuertemente concentrada alrededor de su media. Por ejemplo, si , entonces con alta probabilidad difiere de su expectativa en la cantidad que se muestra en la parte superior de esta respuesta [ Thm. 1 ] (Nota: este límite superior es, creo, flojo, dada la respuesta de Yuri.) Por lo tanto, con alta probabilidad, y también difieren a lo sumo, y y difieren en a lo mucho esto.mnlog3nX1X1X2XmaxXmaxsec

Por el contrario, para un límite inferior (algo más débil), si, para cualquier , digamos, , entonces es al menos que (por el límite de la unión ingenua) es al menos Creo que esto debería darle (por ejemplo) la expectativa de dentro de un factor constante.Pr [ | XtPr[|X1X2|t]3/4Pr[XmaxXsec-maxt]

Pr[|X1X2|t  XmaxXsec-max=|X1X2|]
1(1/4)(1/2)=1/4.XmaxXsec-max

Mirando a Thm. 1, la diferencia con la expectativa es , y no lo que escribió. Eso sigue siendo mucho mejor que . O((m/n)loglogn)O((m/n)logn)
Yuval Filmus

Por Thm. 1 (su tercer caso), para cualquier , con probabilidad , el máximo en cualquier bin (m bolas en n bins) es Según mis cálculos (usando ), el término se expande a un término absoluto aditivo de¿Qué estoy haciendo mal? ϵ>01o(1)
mn+2mlognn1(1±ϵ)loglogn2logn.
±ϵO(ϵ)1δ=1O(δ)±ϵ
O(ϵ)mlognn loglognlogn = O(ϵ)mn log2lognlogn.
Neal Young

Ah, supongo que tienes razón. Reste dentro de la raíz cuadrada y así es como obtuve mi figura.
Yuval Filmus
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.