Benjamin Doerr ofrece (en el capítulo "Análisis de la heurística de búsqueda aleatoria: herramientas de la teoría de la probabilidad" en el libro "Teoría de la heurística de búsqueda aleatoria", vea el enlace para un PDF en línea) una prueba algo simple de
Propuesta Deje que sea el tiempo de parada del proceso de recolección de cupones. Entonces .Pr [ T ≤ ( 1 - ϵ ) ( n - 1 ) ln n ] ≤ e - n ϵTPr[T≤(1−ϵ)(n−1)lnn]≤e−nϵ
Esto parece dar las asíntotas deseadas (de la segunda respuesta de @ cardinal), pero con la ventaja de ser cierto para todos y .ϵnϵ
Aquí hay un boceto de prueba.
Boceto de prueba: Sea el caso de que el -ésimo cupón se recoja en los primeros sorteos. Por lo tanto, . El hecho clave es que las están negativamente correlacionadas, para cualquier , . Intuitivamente, esto es bastante claro, como saber que el cupón -ésimo en el primer atrae haría menos probable que el cupón -ésimo También se señala en el primer atrae. XiitPr[Xi=1]=(1−1/n)tXiI⊆[n]Pr[∀i∈I,Xi=1]≤∏i∈IPr[Xi=1]itjt
Uno puede probar la afirmación, pero ampliando el conjunto en 1 en cada paso. Entonces se reduce a mostrar que , para . De manera equivalente, al promediar, se reduce a mostrar que . Doerr solo da un argumento intuitivo para esto. Una vía para una prueba es la siguiente. Se puede observar que, condicionado al cupón viene después de todos los cupones en , que la probabilidad de sacar un nuevo cupón de después de sacar hasta ahora es ahora , en lugar del anteriorIPr[∀i∈I,Xi=1|Xj=1]≤Pr[∀i∈I,Xi=1]j∉Ij I I k | Yo | - kPr[∀i∈I,Xi=1|Xj=0]≥Pr[∀i∈I,Xi=1]jIIk | Yo| -k|I|−kn−1 jI|I|−kn . Entonces, al descomponer el tiempo para recolectar todos los cupones como una suma de variables geométricas aleatorias, podemos ver que el condicionamiento del cupón que viene después de que aumente las probabilidades de éxito, y por lo tanto, hacer el condicionamiento solo hace que sea más probable recoger los cupones antes por dominio estocástico: cada variable aleatoria geométrica se incrementa, en términos de dominio estocástico, por el condicionamiento, y este dominio se puede aplicar a la suma).jI
Dada esta correlación negativa, se deduce que , que da el límite deseado con . t = ( 1 - ϵ ) ( n - 1 ) ln nPr[T≤(1−ϵ)(n−1)lnn]≤(1−(1−1/n)t)nt=(1−ϵ)(n−1)lnn