Perdón por la respuesta tardía, pero esto también me molestó y encontré la respuesta. La distribución es de hecho Dirichlet-Multinomial y el neg individual. Las distribuciones binomiales ni siquiera necesitan ser idénticas, siempre que su factor Fano (relación de varianza a media) sea idéntico.
Respuesta larga:
Si parametriza NB como:
p(X=x|λ,θ)=NB(x|λ,θ)=(θ−1λ+x−1x)(11+θ−1)x(θ−11+θ−1)θ−1λ
Entonces y yE(X)=λVar(X)=λ(1+θ)
∀i:Xi∼NB(λi,θ) implica
∑Xi∼NB(∑λi,θ)
Luego tomando la probabilidad dada la suma:
∏NB(xi|λi,θ)NB(∑xi|∑λi,θ)=(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi∏(θ−1λi+xi−1xi)(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi(θ−1∑λi+∑xi−1∑xi)==Γ(∑xi+1)Γ(θ−1∑λi)Γ(θ−1∑λi+∑xi)∏Γ(θ−1λi+xi)Γ(xi+1)Γ(θ−1λi)=DM(x1,...,xn|θ−1λ1,...,θ−1λn)
donde es la probabilidad de Dirichlet-Multinomial. Esto resulta simplemente del hecho de que, excepto por los coeficientes multinomiales, muchos de los términos en la fracción en el lado izquierdo se cancelan, dejándolo solo con los términos de la función gamma que resultan ser los mismos que en la probabilidad de DM.DM
También tenga en cuenta que los parámetros de este modelo no son identificables ya que un aumento en con una disminución simultánea en todos los resultados de tiene exactamente la misma probabilidad.θλi
La mejor referencia que tengo para esto es las secciones 2 a 3.1 de Guimarães y Lindrooth (2007): Control para la sobredispersión en modelos logit condicionales agrupados: una aplicación computacionalmente simple de regresión multinomial de Dirichlet - desafortunadamente es un pago, pero no pude encuentre una referencia sin pago de fondos.