Sugerencias para la integral numérica sobre la distribución de Pólya


8

Este problema surge de un proyecto de modelado estadístico bayesiano. Para poder calcular con mi modelo, necesito realizar una integración en la que parte del integrando sea la distribución "Pólya" o "Dirichlet-Multinomial",

p(nα)=(N!)Γ(Kα)Γ(α)KΓ(N+Kα)i=1KΓ(ni+α)ni!

donde y son enteros, y . La integral que deseo calcular, , funciona bien para pequeña , pero los métodos de cuadratura que he intentado (en MATLAB) se rompen hacia abajo a medida que hace grande. No he probado Monte Carlo; Un método de cuadratura rápido y preciso sería muy bueno para mi proyecto. N = K i = 1 n i n = ( n 1 , n 2 , , n K ) α > 0 0 ( otros términos ) p ( n | α ) d α N NniN=i=1Knin=(n1,n2,,nK)α>00(other terms)p(n|α)dαNnorte

Actualmente, el "mejor" método cuando es grande es calcular sobre una cuadrícula en alfa, normalizar y exponer. Esto es inexacto (pierdo esencialmente todos los detalles sobre la distribución, excepto sus picos), pero al menos produce un número.log [ p ( n | α ) ]nortelog[pags(norteEl |α)]

Agradecería cualquier consejo sobre cómo mejorar este cómputo, o punteros a diferentes algoritmos / métodos o software existente.

EDITAR: tal vez debería agregar que mi evaluación de , realizada calculando usando un código cuidadosamente escrito para calcular para grande , no parece estar causando ningún problema.pags(norteEl |α)Iniciar sesiónpags(norteEl |α)Iniciar sesiónΓ(X)X

EDIT 2: Además, los valores "grandes" estarían en el orden de , con el mayor , junto con muchos valores pequeños de . Los otros términos son numéricamente bien comportados. Como una simplificación con aproximadamente el comportamiento de cola apropiado, podría tomarnorte108norteyo105 5norteyo

(otros terminos)=Exp(-α)


¿Puedes dar un ejemplo típico / concreto integral? Por ejemplo, ¿dando valores para n_i, N, a y los (otros términos)?
Andrew Moylan

¡Ciertamente lo hare!

@sydeulissie: ¿resolvió el problema (ya que no publicó un ejemplo típico)?
GertVdE

This is inaccurate (I lose essentially all detail about the distribution except its peaks), but at least produces a number. No entiendo por qué esto debería ser un problema. El resultado en un enfoque bayesiano siempre está dominado por los picos (piense en la navaja de afeitar de occam). Las características locales le darán una contribución despreciable a las probabilidades finales.
Bort

Respuestas:


-1

Para la integración, use una regla de cuadratura gaussiana cuando trate con exponenciales como regla general. A modo de ejemplo, la integración de una función cúbica sobre un área pequeña con la regla de los simpsons o la regla trapezoidal no necesita una gran N, pero usarlas para una función exponencial conduce a una gran N necesaria para lograr la convergencia. Así que siempre opte por un interpolante basado en exponenciales (es decir: regla de cuadratura gaussiana). Si esto falla, debe trazar la función para ver qué tan rápido está oscilando y cómo muere / sube con el área de integración.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.