Respuesta corta: Sí, de manera probabilística. Es posible demostrar que, dada cualquier distancia , cualquier subconjunto finito { x 1 , ... , x m } del espacio muestral y cualquier 'tolerancia' prescrita δ > 0 , para tamaños de muestra adecuadamente grandes, podemos estar seguros de que la probabilidad de que haya un punto de muestra dentro de una distancia ϵ de x i es > 1 - δ para todo i = 1 , ... , m .ϵ>0{x1,…,xm}δ>0ϵxi>1−δi=1,…,m
Respuesta larga: no conozco ninguna cita directamente relevante (pero ver más abajo). La mayor parte de la literatura sobre el muestreo latino de hipercubos (LHS) se relaciona con sus propiedades de reducción de varianza. El otro problema es, ¿qué significa decir que el tamaño de la muestra tiende a ? Para el muestreo aleatorio IID simple, una muestra de tamaño n se puede obtener de una muestra de tamaño n - 1 añadiendo una muestra independiente adicional. Para LHS, no creo que pueda hacer esto ya que la cantidad de muestras se especifica de antemano como parte del procedimiento. Así que parece que usted tendría que tomar una serie de independientes muestras LHS de tamaño 1 , 2 , 3 , . .∞nn−1.1,2,3,...
∞1,2,3,...[0,1)2nXn=(Xn1,Xn2,...,Xnn)nnϵ>0x[0,1)dP(min1≤k≤n∥Xnk−x∥≥ϵ)→0n→∞
Si la muestra se obtiene tomando muestras independientes de la distribución ('muestreo aleatorio IID'), entonces donde es el volumen de la bola dimensional de radio . Entonces, ciertamente, el muestreo aleatorio de IID es asintóticamente denso.XnnU([0,1)d)
P(min1≤k≤n∥Xnk−x∥≥ϵ)=∏k=1nP(∥Xnk−x∥≥ϵ)≤(1−vϵ2−d)n→0
vϵdϵ
Ahora considere el caso de que las muestras son obtenidas por LHS. El teorema 10.1 en estas notas establece que los miembros de la muestra están todos distribuidos como . Sin embargo, las permutaciones utilizadas en la definición de LHS (aunque independientes para diferentes dimensiones) inducen cierta dependencia entre los miembros de la muestra ( ), por lo que es menos obvio que la propiedad de densidad asintótica se mantiene.XnXnU([0,1)d)Xnk,k≤n
Arregle y . Defina . Queremos mostrar que . Para hacer esto, podemos hacer uso de la Proposición 10.3 en esas notas , que es una especie de Teorema del límite central para el muestreo latino de hipercubos. Defina por si está en la bola de radio alrededor de , contrario. Luego, la Proposición 10.3 nos dice que donde yϵ>0x∈[0,1)dPn=P(min1≤k≤n∥Xnk−x∥≥ϵ)Pn→0f:[0,1]d→Rf(z)=1zϵxf(z)=0Yn:=n−−√(μ^LHS−μ)→dN(0,Σ)μ=∫[0,1]df(z)dzμ^LHS=1n∑ni=1f(Xni) .
Toma . Eventualmente, para suficientemente grande , tendremos . Entonces eventualmente tendremos . Por lo tanto, , donde es el cdf normal estándar. Como era arbitrario, se deduce que según sea necesario.L>0n−n−−√μ<−LPn=P(Yn=−n−−√μ)≤P(Yn<−L)lim supPn≤lim supP(Yn<−L)=Φ(−LΣ√)ΦLPn→0
Esto demuestra la densidad asintótica (como se definió anteriormente) tanto para el muestreo aleatorio iid como para el LHS. Informalmente, esto significa que dado cualquier y cualquier en el espacio de muestreo, la probabilidad de que la muestra llegue a de se puede hacer tan cercana a 1 como desee eligiendo el tamaño de muestra lo suficientemente grande. Es fácil extender el concepto de densidad asintótica para aplicarlo a subconjuntos finitos del espacio muestral, aplicando lo que ya sabemos a cada punto en el subconjunto finito. Más formalmente, esto significa que podemos mostrar: para cualquier y cualquier subconjunto finito del espacio muestral,ϵxϵxϵ>0{x1,...,xm}min1≤j≤mP(min1≤k≤n∥Xnk−xj∥<ϵ)→1 (como ).n→∞