Número esperado de duplicados (triplicados, etc.) al dibujar con reemplazo


10

Tengo el siguiente problema:

Tengo 100 elementos únicos (n), y estoy seleccionando 43 (m) de ellos uno a la vez (con reemplazo).

Necesito resolver el número esperado de exclusivos (solo seleccionados una vez, k = 1), dobles (seleccionados exactamente dos veces k = 2), triples (exactamente k = 3), quads, etc.

He podido encontrar muchos resultados sobre la probabilidad de que haya al menos un doble (paradoja del cumpleaños), pero no sobre el número esperado de pares en la población.


¿Le sería útil una estimación de Monte Carlo o necesita la respuesta en forma cerrada?
David J. Harris

Preferiría una fórmula de forma cerrada para poder aplicarla fácilmente a diferentes valores de n, m y k.
Kaitlyn K

Respuestas:


7

ithBinom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Puede obtener el valor numérico en R con el comando n * dbinom (k, m, 1 / n).


¿Se puede usar esa fórmula para ak = 0 o 1?
Kaitlyn K

Sí puede. Con k = 0, puede interpretarlo como "cuántos puntos no aparecerán entre los m seleccionados".
Stefan Wager

Pero estos eventos no son independientes. Por ejemplo, cuando el elemento 1 aparece m veces, no puede aparecer ningún otro elemento. No puedes simplemente sumar las P's.
asterix314
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.