Since the question is related to making the Poisson distribution more understandable, I'll give it a go, since I recently looked into this somewhat for call center incoming call patterns (which follow a memory-less, exponential distribution as time goes on).
I think delving into another tangential model that essentially requires knowledge of Poisson to realize how it isn't one may be somewhat confusing, but that's just me.
I think the trouble with understanding Poisson is the continuous time axis it's on --- as every second goes on, the event is no more likely to occur --- but the further out in the future you go, the more certain it is of happening.
Realmente, creo que simplifica la comprensión si solo cambias el eje 'tiempo' por 'pruebas' o 'eventos'.
Alguien puede corregirme si esto está fuera de lugar, ya que creo que es una explicación fácil, pero creo que puede reemplazar el lanzamiento de una moneda o el lanzamiento de un dado, con 'tiempo hasta que llegue una llamada telefónica' (lo que yo normalmente se usa para el personal de Erlang C / call center).
En lugar de "tiempo hasta que lleguen las llamadas telefónicas", puede reemplazarlo con ... "tira hasta que un dado llegue a seis".
Eso sigue la misma lógica general. La probabilidad (como cualquier juego de apuestas) es completamente independiente en cada tirada (o minuto) y no tiene memoria. Sin embargo, la probabilidad de 'no 6' disminuye cada vez más lentamente, pero seguramente hacia 0 a medida que aumenta el número de ensayos. Es más fácil si ve ambos gráficos (probabilidad de llamada con tiempo, versus probabilidad de seis con rollos).
No sé si eso tiene sentido, eso es lo que me ayudó a ponerlo en términos concretos. Ahora, la distribución de Poisson es un recuento en lugar de "tiempo entre llamadas" o "pruebas hasta obtener un seis", pero se basa en esta probabilidad.