¿Cuál es la distribución de probabilidad de esta suma aleatoria de variables de Bernoulli no iid?

9

Estoy tratando de encontrar la distribución de probabilidad de una suma de un número aleatorio de variables que no están distribuidas de manera idéntica. Aquí hay un ejemplo:

John trabaja en un centro de atención al cliente. Recibe llamadas con problemas y trata de resolverlos. Los que no puede resolver, los reenvía a su superior. Supongamos que la cantidad de llamadas que recibe en un día sigue una distribución de Poisson con media . La dificultad de cada problema varía desde cosas bastante simples (que definitivamente puede tratar) hasta preguntas muy especializadas que no sabrá cómo resolver. Suponga que la probabilidad que pueda resolver el i -ésimo problema sigue una distribución Beta con los parámetros y y es independiente de los problemas anteriores. ¿Cuál es la distribución de la cantidad de llamadas que resuelve en un día? $\mu$ $p_i$ $\alpha$ $\beta$

Más formalmente, tengo:

$Y = I(N > 0)\sum_{i = 0}^{N} X_i$ para $i = 0, 1, 2, ..., N$

donde , y $N \sim \mathrm{Poisson}(\mu)$ $(X_i | p_i) \sim \mathrm{Bernoulli}(p_i)$ $p_i \sim \mathrm{Beta}(\alpha, \beta)$

Tenga en cuenta que, por ahora, estoy feliz de asumir que las son independientes. También acepto que los parámetros y no se afectan entre sí, aunque en un ejemplo real de esto cuando es grande, los parámetros y son tales que la distribución Beta tiene más masa en bajas tasas de éxito . Pero ignoremos eso por ahora. $X_i$ $\mu, \alpha$ $\beta$ $\mu$ $\alpha$ $\beta$ $p$

Puedo calcular pero eso es todo. También puedo simular valores para tener una idea de cómo se ve la distribución de (se parece a Poisson pero no sé si eso se debe a los números de y que probé o si se generaliza, y cómo podría cambiar para diferentes valores de parámetros). ¿Alguna idea de qué es esta distribución o cómo podría derivarla? $P(Y = 0)$ $Y$ $\mu, \alpha$ $\beta$

Tenga en cuenta que también publiqué esta pregunta en el foro TalkStats, pero pensé que podría recibir más atención aquí. Disculpas por la publicación cruzada y muchas gracias de antemano por su tiempo.

EDITAR : Como resulta (ver las respuestas muy útiles a continuación, ¡y gracias por eso!), De hecho es una distribución , algo que estaba adivinando en base a mi intuición y algunas simulaciones, pero no pude demostrarlo. Sin embargo, lo que ahora encuentro sorprendente es que la distribución de Poisson solo depende de la media de la distribución pero no se ve afectada por su varianza. $\mathrm{Poisson}(\frac{\mu\alpha}{\alpha + \beta})$ $\mathrm{Beta}$

Como ejemplo, las siguientes dos distribuciones Beta tienen la misma media pero varianza diferente. Para mayor claridad, el pdf azul representa un y el rojo . $\mathrm{Beta}(2, 2)$ $\mathrm{Beta}(0.75, 0.75)$

Sin embargo, ambos darían como resultado la misma distribución que, para mí, parece un poco contra-intuitiva. (No digo que el resultado sea incorrecto, ¡simplemente sorprendente!) $\mathrm{Poisson}(0.5\mu)$

probability distributions random-variable

— Constantinos
fuente

Para fijo hay distribución de Poisson-binomial, pero su problema es más complicado que esto.

N

$N$

— Tim

Gracias, sé de la distribución binomial de Poisson, pero es aleatorio aquí.

N

$N$

— Constantinos

Puede echar un vistazo al Poisson compuesto , pero es posible que deba trabajar un poco con los ceros para que sea útil

— Glen_b: reinstale a Monica

6

Las llamadas (es decir, la ) llegan de acuerdo con un proceso de Poisson. El número total de llamadas sigue una distribución de Poisson. Divida las llamadas en dos tipos, por ejemplo, si o . El objetivo es determinar el proceso que genera los s. Esto es trivial si con una probabilidad fija : según el principio de superposición de los procesos de Poisson, el proceso completo reducido a solo s también sería un proceso de Poisson, con una tasa . De hecho, este es el caso, solo necesitamos un paso adicional para llegar allí. $X_i$ $N$ $X_i = 1$ $X_i = 0$ $1$ $X_i = 1$ $p$ $1$ $p\mu$

Marginar sobre , de modo que $p_i$

PAG r (X_{yo} El | α, β) = \int_{0 0}^{1} {pag}_{yo}^{X_{yo}} (1 - {pag}_{yo})^{1 - X_{yo}} \frac{{pag}_{yo}^{α - 1} (1 - {pag}_{yo})^{β - 1}}{si (α, β)} re {pag}_{yo} = \frac{si (X_{yo} + α, 1 - X_{yo} + β)}{si (α, β)}

$\mathrm{Pr}(X_i|\alpha, \beta) = \int_0^1 p_i^{X_i} (1-p_i)^{1-X_i} \frac{p_i^{\alpha-1} (1-p_i)^{\beta-1}}{\mathcal{B}(\alpha, \beta)} dp_i = \frac{\mathcal{B}(X_i + \alpha, 1 - X_i + \beta)}{\mathcal{B}(\alpha, \beta)}$

Donde es la función beta. Usando el hecho de que , lo anterior se simplifica a; $\mathcal{B}(a, b) = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a + b)}$ $\Gamma(x+1) = x\Gamma(x)$

PAG r (X_{yo} = 1 El | α, β) = \frac{Γ (1 + α) Γ (β)}{Γ (1 + α + β)} \frac{Γ (α + β)}{Γ (α) Γ (β)} = \frac{α}{α + β}

$\mathrm{Pr}(X_i = 1|\alpha, \beta) = \frac{\Gamma(1+\alpha)\Gamma(\beta)}{\Gamma(1+\alpha+\beta)} \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} = \frac{\alpha}{\alpha+\beta}$ En otras palabras, . Por la propiedad de superposición, es Poisson distribuido con tasa .

X_{i} \sim B e r n o u l l i (\frac{α}{α + β})

$X_i \sim \mathrm{Bernoulli}(\frac{\alpha}{\alpha+\beta})$

Y

$Y$

\frac{α μ}{α + β}

$\frac{\alpha \mu}{\alpha+\beta}$

Un ejemplo numérico (con R) ... en la figura, las líneas verticales son de simulación y los puntos rojos son los pmf derivados arriba:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

— Papa Nate
fuente

3

Como es una variable aleatoria con un , tiene y esta es, de hecho, la probabilidad que Juan realmente resuelve el ª problema, independientemente de todas las demás. $p_i$ $\operatorname{Beta}(\alpha,\beta)$ $\mathbb{E}[p_i]= \dfrac{\alpha}{\alpha+\beta}$ $i$
Como el número total de problemas en un día tiene una distribución de Poisson con el parámetro y cada uno se resolverá con probabilidad , el número que John resuelve cada día tiene una distribución de Poisson con el parámetro $\mu$ $\dfrac{\alpha}{\alpha+\beta}$ $\dfrac{\mu\alpha}{\alpha+\beta}$
Su cálculo de la probabilidad de que no resuelva ningún problema debe ser $\mathbb{P}(Y=0) = e^{-{\mu\alpha}/({\alpha+\beta})}$

— Enrique
fuente