Tengo una tina bien mezclada que contiene un número infinito de canicas. Hay una cantidad infinita de canicas en el tanque, pero solo vienen en un número desconocido pero finito de variedades : es desconocido, y para , dibujar una canica de tipo podría ser más probable que dibujar una canica de tipo .
En un experimento, una máquina toma muestras del tanque utilizando algún procedimiento desconocido. La máquina informa un conjunto describe variedades de canicas de su muestra:
Los ensayos de este experimento se repiten ( se corrige entre ensayos) y obtenemos una secuencia de subconjuntos de , .
Las únicas otras cosas que sabemos son:
- los ensayos son independientes e idénticos
- la máquina informa las principales variedades más frecuentes en su muestra
No sabemos con precisión cómo la máquina toma muestras de canicas. Podría recoger una gran cantidad de canicas, luego reportar la más frecuente. Alternativamente, podría seguir recogiendo canicas hasta que haya variedades. Hay otras cosas que podría hacer también.
¿La distribución de nuestras pruebas verá afectada por el procedimiento de muestreo de la máquina?