Comprenda intuitivamente por qué la distribución de Poisson es el caso limitante de la distribución binomial

14

En "Análisis de datos" por DS Sivia, hay una derivación de la distribución de Poisson, de la distribución binomial.

Argumentan que la distribución de Poisson es el caso limitante de la distribución binomial cuando $M\rightarrow\infty$ , donde es el número de ensayos. $M$

Pregunta 1: ¿Cómo se puede entender intuitivamente ese argumento?

Pregunta 2: ¿Por qué el límite grande de igual a , Donde es el número de éxitos en ensayos? (Este paso se usa en la derivación). $M$ $\frac{M!}{N!(M-N)!}$ $\frac{M^{N}}{N!}$ $N$ $M$

— Ytsen de Boer
fuente

Esto es relevante: stats.stackexchange.com/questions/180057/…

— kjetil b halvorsen

5

Intentaré una explicación simple e intuitiva. Registre que para una variable aleatoria binomial tenemos la expectativa de y la varianza es . Ahora piense que registra el número de eventos en un número muy grande de ensayos, cada uno con una probabilidad muy pequeña $X \sim \text{Bin}(n,p)$ $n p$ $n p (1-p)$ $X$ $n$ $p$ , de modo que estamos muy cerca de (realmente ). Entonces tenemos $1-p=1$ $\approx$ $np=\lambda$ digamos, y , entonces la media y la varianza son iguales a . ¡Entonces recuerde que para una variable aleatoria distribuida de Poisson, siempre tenemos media y varianza igual! Ese es al menos un argumento de plausibilidad para la aproximación de Poisson, pero no una prueba. $n p (1-p) \approx n p 1 =\lambda$ $\lambda$

Luego mírelo desde otro punto de vista, el proceso del punto de Poisson https://en.wikipedia.org/wiki/Poisson_point_process en la línea real. Esta es la distribución de puntos aleatorios en la línea que obtenemos si los puntos aleatorios ocurren de acuerdo con las reglas:

los puntos en intervalos separados son independientes
La probabilidad de un punto aleatorio en un intervalo muy corto es proporcional a la duración del intervalo
La probabilidad de dos o más puntos en un intervalo muy corto es esencialmente cero.

Entonces, la distribución del número de puntos en un intervalo dado (no necesariamente corto) es Poisson (con el parámetro proporcional a la longitud). Ahora, si dividimos este intervalo en muchos subintervalos igualmente cortos ( ), la probabilidad de dos o más puntos en un subintervalo dado es esencialmente cero, por lo que ese número tendrá, en una muy buena aproximación, una distribución de bernolli, es decir, , entonces la suma de todo esto será , entonces una buena aproximación de la distribución de Poisson de la cantidad de puntos en ese intervalo (largo). $\lambda$ $n$ $\text{Bin}(1,p)$ $\text{Bin}(n,p)$

Edición de @Ytsen de Boer (OP): la pregunta número 2 es respondida satisfactoriamente por @ Łukasz Grad.

— kjetil b halvorsen
fuente

6

Permítanme proporcionar una heurística alternativa. Voy a mostrar cómo aproximar el proceso de Poisson como un binomio (y argumentar que la aproximación es mejor para muchos ensayos con baja probabilidad). Por lo tanto, la distribución binomial debe tender a la distribución de Poisson.

Digamos que los eventos están sucediendo con una velocidad constante en el tiempo. Queremos saber la distribución de cuántos eventos ocurrieron en un día, sabiendo que el número esperado de eventos es $\lambda$ .

Bueno, el número esperado de eventos por hora es $\lambda/24$ . Supongamos que esto significa que la probabilidad de que ocurra un evento en una hora determinada es $\lambda/24$ . [no está del todo bien, pero es una aproximación decente si $\lambda/24 \ll 1$ básicamente si podemos suponer que no ocurren múltiples eventos en la misma hora]. Luego podemos aproximar la distribución del número de eventos como un binomio con $M=24$ ensayos, cada uno con probabilidad de éxito $\lambda/24$ .

Mejoramos la aproximación cambiando nuestro intervalo a minutos. Entonces es $p=\lambda/1440$ con $M=1440$ ensayos. Si $\lambda$ está cerca, digamos 10, entonces podemos estar bastante seguros de que ningún minuto tuvo dos eventos.

Por supuesto, mejora si cambiamos a segundos. Ahora estamos viendo eventos $M=86400$ , cada uno con la pequeña probabilidad $\lambda/86400$ .

No importa cuán grande sea su $\lambda$ , eventualmente puedo elegir un $\Delta t$ suficientemente pequeño como que sea muy probable que no ocurran dos eventos en el mismo intervalo. Entonces la distribución binomial correspondiente a ese $\Delta t$ será una excelente coincidencia con la verdadera distribución de Poisson.

La única razón por la que no son exactamente iguales es que hay una probabilidad distinta de cero de que ocurran dos eventos en el mismo intervalo de tiempo. Pero dado que solo hay alrededor de eventos $\lambda$ y se distribuyen en un número de contenedores mucho mayor que $\lambda$ , es poco probable que dos de ellos se encuentren en el mismo contenedor.

O en otras palabras, la distribución binomial tiende a la distribución de Poisson como $M \to \infty$ si la probabilidad de éxito es $p=\lambda/M$ .

— Joel
fuente

5

Pregunta 1

Recordemos la definición de la distribución binomial:

una distribución de frecuencia del posible número de resultados exitosos en un número dado de ensayos en cada uno de los cuales existe la misma probabilidad de éxito.

Compare esto con la definición de la distribución de Poisson:

Una distribución de frecuencia discreta que da la probabilidad de que ocurran varios eventos independientes en un tiempo fijo .

La diferencia sustancial entre los 2 es que el binomio está en ensayos, Poisson está en un período de tiempo $n$ $t$ . ¿Cómo puede ocurrir el límite intuitivamente?

Digamos que tienes que seguir ejecutando pruebas de Bernoulli por toda la eternidad. Además, ejecutas por minuto. Por minuto cuentas cada éxito. Entonces, durante toda la eternidad, ejecuta un proceso cada minuto. Durante 24 horas, tiene un . $n = 30$ $Bin(p,30)$ $Bin(p,43200)$

A medida que se cansa, se le pregunta "¿cuántos éxitos ocurrieron entre las 18:00 y las 19:00?". Su respuesta puede ser , es decir, proporciona los éxitos promedio en una hora. Eso me parece mucho el parámetro de Poisson . $30*60*p$ $\lambda$

5

Pregunta 2)

\frac{\frac{M!}{N! (M - N)!}}{\frac{M^{N}}{N!}} = \frac{M (M - 1) \dots (M - N + 1)}{M^{N}} = 1 (1 - \frac{1}{M}) \dots (1 - \frac{N - 1}{M})

$\frac{\frac{M!}{N!(M-N)!}}{\frac{M^N}{N!}} = \frac{M(M-1)\dots(M - N + 1)}{M^N} = 1(1 - \frac{1}{M})\dots(1 - \frac{N - 1}{M})$

Entonces tomar el límite para fijo $N$

lim_{M \to \infty} \frac{\frac{M!}{N! (M - N)!}}{\frac{M^{N}}{N!}} = lim_{M \to \infty} 1 (1 - \frac{1}{M}) \dots (1 - \frac{N - 1}{M}) = 1

$\lim_{M \to \infty} \frac{\frac{M!}{N!(M-N)!}}{\frac{M^N}{N!}} = \lim_{M \to \infty} 1(1 - \frac{1}{M})\dots(1 - \frac{N - 1}{M}) = 1$

— Łukasz Grad
fuente

+1. Comencé mirando la aproximación de Stirling, pero comencé a correr en círculos. Tu enfoque es mucho más simple.

No creo que esto sea lo que el OP encontrará intuitivo ...

— kjetil b halvorsen

@kjetilbhalvorsen Traté de usar las matemáticas más sencilla posible, de manera intuitiva para el gran

tenemos

para fijo

M

$M$

M ≂ M - k

$M \eqsim M - k$

k << M

$k << M$

— Łukasz Grad

1

@kjetilbhalvorsen Esta es una respuesta a Q2 (paso de derivación), no Q1 (explicación intuitiva)

— Ben Bolker

@TemplateRex Hmm, pero creo que cuando pruebo la convergencia puntual solo necesito demostrarlo para cada

fija , ya que

va a la infinidad, ¿no? Eso es

N

$N$

M

$M$

\forall_{ω \in Ω} lim_{m \to \infty} X_{m} (ω) \to X (ω)

$\forall_{\omega \in \Omega} \lim_{m \to \infty} X_m(\omega) \to X(\omega)$

— Łukasz Grad

5

El problema es que su caracterización del Poisson como un caso limitante de la distribución binomial no es del todo correcto como se indicó .

El Poisson es un caso limitante del binomio cuando: La segunda parte es importante. Si permanece fijo, la primera condición implica que la tasa también aumentará sin límite.

M \to \infty and M p \to λ .

$M \to \infty \quad \color{red}{\text{and} \quad Mp \to \lambda.}$

p

$p$

Lo que la distribución de Poisson supone es que los eventos son raros . Lo que queremos decir con "raro" no es que la tasa de eventos sea pequeña, de hecho, un proceso de Poisson puede tener una intensidad muy alta , sino que la probabilidad de que ocurra un evento en cualquier instante es muy pequeña. Esto está en contraste con un modelo binomial donde la probabilidad $\lambda$ $[t, t + dt)$ $p$ de un evento (por ejemplo, "éxito") se fija para cualquier ensayo dado.

Para ilustrar, supongamos que modelamos una serie de ensayos de Bernoulli independientes, cada uno con probabilidad de éxito , y observamos qué sucede con la distribución del número de éxitos como . Para cualquier tan grande como queramos, y no importa cuán pequeño sea , el número esperado de éxitos para $M$ $p$ $X$ $M \to \infty$ $N$ $p$ $\operatorname{E}[X] = Mp > N$ $M > N/p$ . Dicho de otra manera, no importa cuán improbable sea la probabilidad de éxito, eventualmente puede lograr un número promedio de éxitos tan grande como desee si realiza suficientes pruebas. Entonces, (o simplemente diciendo " es grande") no es suficiente para justificar un modelo de Poisson para $M \to \infty$ $M$ $X$ .

No es difícil establecer algebraicamente

Pr [X = x] = e^{- λ} \frac{λ^{x}}{x!}, x = 0, 1, 2, \dots

$\Pr[X = x] = e^{-\lambda} \frac{\lambda^x}{x!}, \quad x = 0, 1, 2, \ldots$

Pr [X = x] = (\binom{M}{x}) p^{x} (1 - p)^{M - x}, x = 0, 1, 2, \dots, M

$\Pr[X = x] = \binom{M}{x} p^x (1-p)^{M-x}, \quad x = 0, 1, 2, \ldots, M$

p = λ / M

$p = \lambda/M$

M \to \infty

$M \to \infty$ . Other answers here have addressed the intuition behind this relationship and provided computational guidance as well. But it is important that

p = λ / M

$p = \lambda/M$ . You can't ignore this.

— heropup
fuente

0

I can only attempt a part answer and it is about the intuition for Question 2, not a rigorous proof.

The binomial coefficient gives you the number of samples of size $N$ , from $M$ , without replacement and without order.

Here though $M$ becomes so large that you may approximate the scenario as sampling with replacement in which case you get $M^N$ ordered samples. If you don't care about the order of the $N$ objects chosen this reduces to $M^N/N!$ because those $N$ objects can be ordered in $N!$ ways.

— PM.
fuente

-2

I think this is the best example that intuitively explains how binomial distribution converges to normal with large number of balls. Here, each ball has equal probability of falling on either side of the peg in each layer and all the balls have to face same number of pegs. It can be easily seen that as the number of balls goes very high the distribution of balls in different sections will be like normal distribution.

My answer to your question 2 is same as the answer given by Lukasz.

— samwise_the_wise
fuente

2

This isn't really answering the question, it answers another question ...

— kjetil b halvorsen

I have tried to intuitively explain what asked in question 1. Can you please elaborate why you think it is not an answer to it?

— samwise_the_wise

1

Sorry, I got the point now. I answered a completely different question. My bad.

— samwise_the_wise

1

I see a heavily discretized version of a binomial distribution. Why should it be obvious that the distribution of balls at the bottom of this quincunx should be normal? Regardless of how many balls you drop through this machine, you will still get a distribution of counts in 13 bins: that cannot possibly be normal!

— whuber