Sí , hay muchas formas de producir una secuencia de números que se distribuyen de manera más uniforme que los uniformes aleatorios. De hecho, hay todo un campo dedicado a esta pregunta; Es la columna vertebral de cuasi-Monte Carlo (QMC). A continuación se muestra un breve recorrido por los conceptos básicos absolutos.
Medición de uniformidad
Hay muchas formas de hacer esto, pero la forma más común tiene un sabor fuerte, intuitivo y geométrico. Supongamos que estamos interesados en generar puntos en para algún número entero positivo . Definir
donde es un rectángulo en tal que yx 1 , x 2 , … , x n [ 0 , 1 ] d dnx1,x2,…,xn[0,1]dd
Dn:=supR∈R∣∣∣1n∑i=1n1(xi∈R)−vol(R)∣∣∣,
R[a1,b1]×⋯×[ad,bd][0,1]d0≤ai≤bi≤1Res el conjunto de todos esos rectángulos. El primer término dentro del módulo es la proporción "observada" de puntos dentro de y el segundo término es el volumen de , .
RRvol(R)=∏i(bi−ai)
La cantidad menudo se denomina discrepancia o discrepancia extrema del conjunto de puntos . Intuitivamente, encontramos el "peor" rectángulo donde la proporción de puntos se desvía más de lo que esperaríamos con una uniformidad perfecta.Dn(xi)R
Esto es difícil de manejar en la práctica y difícil de calcular. En su mayor parte, las personas prefieren trabajar con la discrepancia de estrella ,
La única diferencia es el conjunto sobre el cual se toma el supremum. Es el conjunto de rectángulos anclados (en el origen), es decir, donde .
D⋆n=supR∈A∣∣∣1n∑i=1n1(xi∈R)−vol(R)∣∣∣.
Aa1=a2=⋯=ad=0
Lema : para todos , . Prueba . La mano izquierda unida es obvia ya que . El límite a la derecha sigue porque cada se puede componer mediante uniones, intersecciones y complementos de no más de rectángulos anclados (es decir, en ).D⋆n≤Dn≤2dD⋆nnd
A⊂RR∈R2dA
Por lo tanto, vemos que y son equivalentes en el sentido de que si uno es pequeño a medida que crece, el otro también lo será. Aquí hay una imagen (caricatura) que muestra rectángulos candidatos para cada discrepancia.DnD⋆nn
Ejemplos de secuencias "buenas"
Las secuencias con discrepancia de estrella verificablemente baja menudo se denominan, como era de esperar, secuencias de baja discrepancia .D⋆n
Van der Corput . Este es quizás el ejemplo más simple. Para , las secuencias de van der Corput se forman expandiendo el número entero en binario y luego "reflejando los dígitos" alrededor del punto decimal. Más formalmente, esto se hace con la función inversa radical en la base ,
donde y son los dígitos en la expansión base de . Esta función forma la base de muchas otras secuencias también. Por ejemplo, en binario es y asíd=1ib
ϕb(i)=∑k=0∞akb−k−1,
i=∑∞k=0akbkakbi41101001a0=1 , , , , y . Por lo tanto, el punto 41 en la secuencia de van der Corput es .
a1=0a2=0a3=1a4=0a5=1x41=ϕ2(41)=0.100101(base 2)=37/64
Tenga en cuenta que debido a que el bit menos significativo de oscila entre y , los puntos para impar están en , mientras que los puntos para incluso están en .i01xii[1/2,1)xii(0,1/2)
Secuencias de Halton . Entre las secuencias de baja discrepancia clásicas más populares, estas son extensiones de la secuencia de van der Corput a múltiples dimensiones. Deje que sea la ésima prima más pequeña. Entonces, el ésimo punto de la secuencia dimensional de Halton es
Para baja estos funcionan bastante bien, pero tienen problemas en dimensiones más altas .pjjixid
xi=(ϕp1(i),ϕp2(i),…,ϕpd(i)).
d
Las secuencias de Halton satisfacen . También son agradables porque son extensibles porque la construcción de los puntos no depende de una elección a priori de la longitud de la secuencia .D⋆n=O(n−1(logn)d)n
Secuencias de Hammersley . Esta es una modificación muy simple de la secuencia de Halton. En su lugar, usamos
Quizás sorprendentemente, la ventaja es que tienen una mejor discrepancia de estrellas .
xi=(i/n,ϕp1(i),ϕp2(i),…,ϕpd−1(i)).
D⋆n=O(n−1(logn)d−1)
Aquí hay un ejemplo de las secuencias de Halton y Hammersley en dos dimensiones.
Secuencias de Halton permutadas por Faure . Se puede aplicar un conjunto especial de permutaciones (fijadas en función de ) a la expansión de dígitos para cada cuando se produce la secuencia de Halton. Esto ayuda a remediar (hasta cierto punto) los problemas a los que se alude en dimensiones superiores. Cada una de las permutaciones tiene la propiedad interesante de mantener y como puntos fijos.iaki0b−1
Reglas de celosía . Deje que sean enteros. Tome
donde denota la parte fraccional de . La elección juiciosa de los valores produce buenas propiedades de uniformidad. Las malas elecciones pueden conducir a malas secuencias. Tampoco son extensibles. Aquí hay dos ejemplos.β1,…,βd−1
xi=(i/n,{iβ1/n},…,{iβd−1/n}),
{y}yβ
(t,m,s) redes . redes en la base son conjuntos de puntos de manera que cada rectángulo de volumen en contiene puntos. Esta es una forma fuerte de uniformidad. Pequeño es tu amigo, en este caso. Las secuencias de Halton, Sobol 'y Faure son ejemplos de redes . Estos se prestan muy bien a la aleatorización a través de la codificación. La aleatorización aleatoria (correcta) de una red produce otra red . El proyecto MinT mantiene una colección de tales secuencias.(t,m,s)bbt−m[0,1]sbtt(t,m,s)(t,m,s)(t,m,s)
Aleatorización simple: rotaciones de Cranley-Patterson . Sea una secuencia de puntos. Deje . Entonces los puntos se distribuyen uniformemente en .xi∈[0,1]dU∼U(0,1)x^i={xi+U}[0,1]d
Aquí hay un ejemplo con los puntos azules que son los puntos originales y los puntos rojos que son los rotados con líneas que los conectan (y se muestran envueltos, cuando corresponde).
Secuencias completamente distribuidas uniformemente . Esta es una noción aún más fuerte de uniformidad que a veces entra en juego. Sea la secuencia de puntos en y ahora forme bloques superpuestos de tamaño para obtener la secuencia . Entonces, si , tomamos luego , etc. Si, por cada , , entonces se dice que está completamente uniformemente distribuida . En otras palabras, la secuencia produce un conjunto de puntos de cualquier(ui)[0,1]d(xi)s=3x1=(u1,u2,u3)x2=(u2,u3,u4) s≥1D⋆n(x1,…,xn)→0(ui)dimensión que tiene propiedades deseables .D⋆n
Como ejemplo, la secuencia de van der Corput no está completamente distribuida uniformemente ya que para , los puntos están en el cuadrado y los puntos están en . Por lo tanto, no hay puntos en el cuadrado que implica que para , para todo .s=2x2i(0,1/2)×[1/2,1)x2i−1[1/2,1)×(0,1/2)(0,1/2)×(0,1/2)s=2D⋆n≥1/4n
Referencias estándar
La monografía de Niederreiter (1992) y el texto de Fang y Wang (1994) son lugares a donde ir para una mayor exploración.