Deje ser un conjunto finito y supongamos que queremos calcular el tamaño de un subconjunto .X
Motivación : si podemos generar elementos de uniforme al azar, entonces podemos estimar el tamaño de por muestreo aleatorio. Es decir, tomamos muestras aleatorias de , si de ellas pertenecen a , entonces . Desafortunadamente, por lo que hago, generalmentees masivo y(aunque masivo) es bastante pequeño con respecto a. Entonces, si intento realizar la estimación anterior, es probable que obtenga , que, aunque no es inútil, no es realmente tan satisfactorio.A A n A m X | X | / | A | ≈ m / n | A | El | X | El | A | m = 0
Entonces, tengo una idea que espero acelere este proceso. En lugar de lanzar dardos en un tablero de dardos masivo, ¿por qué no arrojo pelotas? Es decir, en lugar de muestreo de elementos , nosotros, los subconjuntos de la muestra . Seguramente debería poder inferir algo sobre la densidad de en partir de este experimento.A X A
Supongamos que está equipado con una métrica (tengo en cuenta la distancia de Hamming). Para cualquier sea sea la bola cerrada de radio en centrada en . Como podemos muestrear elementos uniforme al azar, podemos muestrear bolas uniforme al azar.d ( x , y ) y ∈ A Y ( y ) = { x ∈ A : d ( x , y ) ≤ k } k A t x ∈ A k Y k ( t )
Suponga que (a) cada pertenece exactamente al mismo número de bolas y (b) cada bola tiene el mismo tamaño .k k r
Ahora supongamos que genero bolas uniformemente al azar y supongamos que. Parece que podemos estimarde manera similar, es decir .Y 1 , Y 2 , … , Y n m = ∑ n i = 1 | Y i ∩ X | El | A | El | X | / | A | ≈ m
Entonces mis preguntas son:
¿Tengo razón en que podemos aproximarnos¿de esta manera? Si es así, dudo que sea el primero en pensar en esto, ¿hay algún nombre para este método?
Realmente probé esto en algunos sets, y parece coincidir con lo que afirmo.
¿Hay algún inconveniente en este enfoque? (por ejemplo, ¿es menos preciso? ¿Necesito más muestras?)