La distribución por la que está preguntando se llama distribución binomial de Poisson , con un PMF bastante complicado (consulte Wikipedia para obtener una descripción más amplia)
Pr(X=x)=∑A∈Fx∏i∈Api∏j∈Ac(1−pj)
Generalmente, el problema es que no puede usar esta ecuación para un número mayor de ensayos (generalmente cuando el número de ensayos excede ). También hay otros métodos para calcular el pmf, por ejemplo, fórmulas recursivas, pero son numéricamente inestables. La forma más fácil de solucionar esos problemas son los métodos de aproximación (descritos, por ejemplo, por Hong, 2013 ). Si definimosn=30
μ=∑i=1npi
σ=∑i=1npi(1−pi)−−−−−−−−−−−√
γ=σ−3∑i=1npi(1−pi)(1−2pi)
entonces podemos aproximar pmf con distribución de Poisson a través de la ley de números pequeños o el teorema de Le Cams
Pr(X=x)≈μxexp(−μ)x!
pero ve que, en general, la aproximación binomial se comporta mejor ( Choi y Xia, 2002 )
Pr(X=x)≈Binom(n,μn)
puedes usar la aproximación normal
f(x)≈ϕ(x+0.5−μσ)
o cdf se puede aproximar utilizando la llamada aproximación normal refinada (Volkova, 1996)
F(x)≈max(0, g(x+0.5−μσ))
donde .g(x)=Φ(x)+γ(1−x2)ϕ(x)6
Otra alternativa es, por supuesto, una simulación de Monte Carlo.
La dpbinom
función R simple sería
dpbinom <- function(x, prob, log = FALSE,
method = c("MC", "PA", "NA", "BA"),
nsim = 1e4) {
stopifnot(all(prob >= 0 & prob <= 1))
method <- match.arg(method)
if (method == "PA") {
# poisson
dpois(x, sum(prob), log)
} else if (method == "NA") {
# normal
dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
} else if (method == "BA") {
# binomial
dbinom(x, length(prob), mean(prob), log)
} else {
# monte carlo
tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
tmp <- tmp/sum(tmp)
p <- as.numeric(tmp[as.character(x)])
p[is.na(p)] <- 0
if (log) log(p)
else p
}
}
La mayoría de los métodos (y más) también se implementan en el paquete R poibin .
Chen, LHY (1974). Sobre la convergencia de las distribuciones de Poisson Binomial a Poisson. Los Anales de Probabilidad, 2 (1), 178-180.
Chen, SX y Liu, JS (1997). Aplicaciones estadísticas de las distribuciones de Poisson-Binomial y condicional de Bernoulli. Statistica Sinica 7, 875-892.
Chen, SX (1993). Distribución de Poisson-Binomial, distribución condicional de Bernoulli y entropía máxima. Reporte técnico. Departamento de Estadística, Universidad de Harvard.
Chen, XH, Dempster, AP y Liu, JS (1994). Muestreo de población finita ponderada para maximizar la entropía. Biometrika 81, 457-469.
Wang, YH (1993). Sobre el número de éxitos en ensayos independientes. Statistica Sinica 3 (2): 295-312.
Hong, Y. (2013). Al calcular la función de distribución para la distribución binomial de Poisson. Estadística computacional y análisis de datos, 59, 41-51.
Volkova, AY (1996). Un refinamiento del teorema del límite central para sumas de indicadores aleatorios independientes. Teoría de la probabilidad y sus aplicaciones 40, 791-794.
Choi, KP y Xia, A. (2002). Aproximación del número de éxitos en ensayos independientes: Binomial versus Poisson. Los Anales de Probabilidad Aplicada, 14 (4), 1139-1148.
Le Cam, L. (1960). Un teorema de aproximación para la distribución binomial de Poisson. Pacific Journal of Mathematics 10 (4), 1181–1197.