Una generalización de la pregunta pide la distribución de Y= ⌊ X/ m⌋ cuando la distribución de X es conocida y apoyada en los números naturales. (En la pregunta, X tiene una distribución de Poisson de parámetro λ = λ1+ λ2+ ⋯ + λnorte y m = n ).
La distribución de se determina fácilmente por la distribución de m Y , cuya probabilidad de generación de función (PGF) puede determinarse en términos de la PGF de X . Aquí hay un resumen de la derivación.Ym YX
p ( x ) = p0 0+ p1x + ⋯ + pnorteXnorte+ ⋯Xm Y X qpagnorte= Pr ( X= n )m YXq
q( x )=( p0 0+ p1+ ⋯ + pm - 1) + ( pmetro+ pm + 1+ ⋯ + p2 m - 1) xmetro+ ⋯ +( pn m+ pn m + 1+ ⋯ + p( n + 1 ) m - 1) xn m+ ⋯ .
Porque esto converge absolutamente para , podemos reorganizar los términos en una suma de piezas de la formaEl | x | ≤ 1
rem , tp ( x ) = pt+ pt + mXmetro+ ⋯ + pt + n mXn m+ ⋯
para . La serie de potencias de las funciones consiste en cada término de la serie de comienza con : esto a veces se denomina diezmado de . Las búsquedas de Google actualmente no muestran mucha información útil sobre decimaciones, así que para completar, aquí hay una derivación de una fórmula.x t D m , t p m th p t th pt = 0 , 1 , ... , m - 1Xtrem , tpagmetrothpagtthpag
Sea cualquier primitiva raíz de la unidad; por ejemplo, tome . Luego se deduce de y quem º ω = exp ( 2 i π / m ) ω m = 1 Σ m - 1 j = 0 ω j = 0ωmetrothω = exp( 2 i π/ m)ωmetro= 1∑m - 1j = 0ωj= 0
Xtrem , tp ( x ) = 1metro∑j = 0m - 1ωt jp ( x / ωj) .
Para ver esto, tenga en cuenta que el operador es lineal, por lo que es suficiente verificar la fórmula sobre la base . Aplicando el lado derecho a da { 1 , x , x 2 , ... , x n , ... } x nXtrem , t{ 1 , x , x2, ... , xnorte, ... }Xnorte
Xtrem , t[ xnorte] = 1metro∑j = 0m - 1ωt jXnorteω- n j= xnortemetro∑j = 0m - 1ω( t - n ) j .
Cuando y difieren en un múltiplo de , cada término en la suma es igual a y se obtiene . De lo contrario, los términos pasan por los poderes de y estos suman cero. De donde este operador conserva todos los poderes de congruentes con módulo y mata a todos los demás: es precisamente la proyección deseada.n m 1 x n ω t - n x t mtnortemetro1Xnorteωt - nXtmetro
Sigue fácilmente una fórmula para cambiando el orden de suma y reconociendo una de las sumas como geométrica, escribiéndola así en forma cerrada:q
q( x )= ∑t = 0m - 1( Dm , t[ p ] ) ( x )= ∑t = 0m - 1X- t1metro∑j = 0m - 1ωt jp ( ω- jx )= 1metro∑j = 0m - 1p ( ω- jx ) ∑t = 0m - 1( ωj/ x )t= x ( 1 - x- m)metro∑j = 0m - 1p ( ω- jx )x - ωj.
Por ejemplo, el pgf de una distribución de Poisson del parámetro es . Con , y el pgf de seráp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp ( x ) = exp(λ(x−1))m=2ω=−12Y
q(x)=x(1−x−2)2∑j=02−1p((−1)−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Un uso de este enfoque es calcular momentos de y . El valor de la derivada del pgf evaluado en es el momento factorial . El momento es una combinación lineal de los primeros momentos factoriales. Usando estas observaciones, encontramos, por ejemplo, que para una distribuida por Poisson , su media (que es el primer momento factorial) es igual a , la media de es igual a , y la media de es igual am Y k th x = 1 k th k th k X λ 2 ⌊ ( X / 2 ) ⌋ λ - 1XmYkthx=1kthkthkXλ2⌊(X/2)⌋3⌊(X/3)⌋λ-1+e-3λ/2(sin ( √λ−12+12e−2λ3⌊(X/3)⌋λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Las medias para se muestran en azul, rojo y amarillo, respectivamente, como funciones de : asintóticamente, la media cae en comparación con la media original de Poisson.λ ( m - 1 ) / 2m=1,2,3λ(m−1)/2
Se pueden obtener fórmulas similares para las variaciones. (Se vuelven desordenados a medida que aumenta y, por lo tanto, se omiten. Una cosa que establecen definitivamente es que cuando no hay múltiplo de es Poisson: no tiene la igualdad característica de media y varianza) Aquí hay una gráfica de las variaciones en función de para :m > 1 Y λ m = 1 , 2 , 3mm>1Yλm=1,2,3
Es interesante que para valores mayores de las variaciones aumentan . Intuitivamente, esto se debe a dos fenómenos competitivos: la función de piso efectivamente agrupa grupos de valores que originalmente eran distintos; Esto debe hacer que la varianza disminuya. Al mismo tiempo, como hemos visto, los medios también están cambiando (porque cada bin está representado por su valor más pequeño); esto debe hacer que se vuelva a agregar un término igual al cuadrado de la diferencia de medias. El aumento en la varianza para grandes hace mayor con valores mayores de .λ mλλm
El comportamiento de la varianza de con es sorprendentemente complejo. Terminemos con una simulación rápida (in ) que muestre lo que puede hacer. Las gráficas muestran la diferencia entre la varianza de y la varianza de para Poisson distribuido con varios valores de varían de a . En todos los casos, las gráficas parecen haber alcanzado sus valores asintóticos a la derecha.m m ⌊ X / m ⌋ X X λ 1 5000mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})