¿Cuál es el valor esperado de la distribución Dirichlet modificada? (problema de integración)


14

Es fácil producir una variable aleatoria con distribución de Dirichlet usando variables Gamma con el mismo parámetro de escala. Si:

XiGamma(αi,β)

Luego:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

Problema ¿Qué sucede si los parámetros de la escala no son iguales?

XiGamma(αi,βi)

Entonces, ¿cuál es la distribución de esta variable?

(X1jXj,,XnjXj)?

Para mí sería suficiente saber el valor esperado de esta distribución.
Necesito una fórmula algebraica cerrada aproximada que pueda ser evaluada muy rápidamente por una computadora.
Digamos que una aproximación con una precisión de 0.01 es suficiente.
Puedes asumir que:

αi,βiN

Nota En resumen, la tarea es encontrar una aproximación de esta integral:

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn


1
@ Łukasz ¿Puedes decir algo más sobre los parámetros , α i y β i ? Es posible obtener expresiones exactas para j X j y, por lo tanto, aproximar las expectativas de las proporciones, pero para ciertas combinaciones de los parámetros uno podría explotar aproximaciones normales o de punto de silla de montar con menos trabajo. No creo que haya un método de aproximación universal, por lo que serían bienvenidas restricciones adicionales. nαiβijXj
whuber

yj X j están correlacionados, por lo que tenemos que aproximar la integral en sí. α i es a menudo un número pequeño como 1 o 2 y, a veces, tan grande como 10000. De manera similar con β i pero generalmente es 10 veces más grande que α i . X1jXjαiβiαi
Łukasz Lew

El problema es con una pequeña . Si todos los α i son grandes, entonces la buena aproximación de toda la integral es: α 1 / β 1αiαiα1/β1jαj/βj
Łukasz Lew

@ Łukasz Si necesita evaluar la expresión de la expectativa, ¿por qué necesita una fórmula algebraica? Estoy pensando en la aplicación de un truco numérico obtener la confianza pero necesito algunos comentarios :)
deps_stats

Necesito evaluarlo muchas veces en mi programa. Tiene que ser muy rápido, es decir, sin bucles y preferiblemente sin demasiadas divisiones.
Łukasz Lew

Respuestas:


2

Solo una observación inicial, si desea velocidad de cálculo, generalmente tiene que sacrificar la precisión. "Más precisión" = "Más tiempo" en general. De todos modos, aquí hay una aproximación de segundo orden, debería mejorar el "crudo" aproximado que sugirió en su comentario anterior:

=α j

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

EDIT An explanation for the above expansion was requested. The short answer is wikipedia. The long answer is given below.

write f(x,y)=xy. Now we need all the "second order" derivatives of f. The first order derivatives will "cancel" because they will all involve multiples XE(X) and YE(Y) which are both zero when taking expectations.

2fx2=0
2fxy=1y2
2fy2=2xy3

And so the taylor series up to second order is given by:

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

Taking expectations yields:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Which is the answer I gave. (although I initially forgot the minus sign in the second term)


This looks like exactly what I need. Can you explain how you got this expansion? I tried in a lot of ways and was unable to do that ...
Łukasz Lew
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.