Considere una urna que contiene bolas de diferentes colores, siendo la proporción de bolas de color entre las bolas ( ). Extraigo bolas de la urna sin reemplazo y miro el número de diferentes colores entre las bolas que se dibujaron. ¿Cuál es la expectativa de en función de , dependiendo de las propiedades adecuadas de la distribución ?P p i i N ∑ i p i = 1 n ≤ Nγ n / N p
Para dar más información: si y para todo , siempre veré exactamente colores, es decir, . De lo contrario, se puede demostrar que la expectativa de es . Para y fijos , parecería que el factor por el cual multiplicar sería máximo cuando es uniforme; ¿tal vez el número esperado de colores diferentes visto esté limitado en función de y, por ejemplo, la entropía de ?p i = 1 / P i n γ = P ( n / N ) γ > P ( n / N ) P N n / N p n / N p
Esto parece estar relacionado con el problema del recolector de cupones, excepto que el muestreo se realiza sin reemplazo y la distribución de los cupones no es uniforme.