¿Pasos para descubrir una distribución posterior cuando podría ser lo suficientemente simple como para tener una forma analítica?


12

Esto también se preguntó en Computational Science.

Estoy tratando de calcular una estimación bayesiana de algunos coeficientes para una autorregresión, con 11 muestras de datos: donde ϵ i es gaussiano con media 0 y varianza σ 2 e La distribución previa en el vector ( μ , α ) t es gaussiana con media ( 0 , 0 ) y una matriz de covarianza diagonal con entradas diagonales iguales a σ 2 p .

Yi=μ+αYi1+ϵi
ϵiσe2(μ,α)t(0,0)σp2

Basado en la fórmula de autorregresión, esto significa que la distribución de los puntos de datos (el ) es normal con una media μ + α Yi y varianza σ 2 e . Por lo tanto, la densidad de todos los puntos de datos ( Y ) conjuntamente (suponiendo que la independencia, que está bien para el programa que estoy escribiendo), sería: p ( Yμ+αYi1σe2(Y)

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

Según el teorema de Bayes, podemos tomar el producto de la densidad anterior con la densidad anterior, y luego solo necesitaremos la constante de normalización. Mi presentimiento es que esto debería funcionar como una distribución gaussiana, por lo que podemos preocuparnos por la constante de normalización al final en lugar de calcularla explícitamente con integrales sobre y α .μα

Esta es la parte con la que tengo problemas. ¿Cómo calculo la multiplicación de la densidad anterior (que es multivariada) y este producto de densidades de datos univariadas? La parte posterior debe ser puramente una densidad de y α , pero no puedo ver cómo sacarás eso de ese producto.μα

Cualquier indicador es realmente útil, incluso si solo me señala en la dirección correcta y luego necesito ir y hacer el álgebra desordenado (que es lo que ya he intentado varias veces).

Como punto de partida, aquí está la forma del numerador de la regla de Bayes:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

El problema es cómo ver que esto se reduce a una densidad gaussiana de .(μ,α)t

Adicional

En última instancia, esto se reduce al siguiente problema general. Si le dan alguna expresión cuadrática como ¿cómo poner esto en una forma cuadrática ( μ - μ , α - α ) Q ( μ - μ , α - α ) t para alguna matriz 2x2 Q

Aμ2+Bμα+Cα2+Jμ+Kα+L
(μμ^,αα^)Q(μμ^,αα^)tQ? Es bastante simple en los casos fáciles, pero ¿Qué proceso que se utiliza para obtener las estimaciones de la y α ?μ^α^

Tenga en cuenta que probé la opción directa de expandir la fórmula de la matriz y luego tratar de igualar los coeficientes como se indicó anteriormente. El problema, en mi caso, es que la constante es cero, y luego termino obteniendo tres ecuaciones en dos incógnitas, por lo que no se ha determinado que coincidan los coeficientes (incluso si supongo una matriz de forma cuadrática simétrica).L


Mi respuesta a [esta pregunta] ( stats.stackexchange.com/questions/22852/… ) puede ser útil. Tenga en cuenta que necesita un previo para su primera observación: las iteraciones se detienen allí.
probabilistico

No veo por qué lo necesito en este caso. Se supone que debo tratar los intervalos de tiempo como si fueran condicionalmente independientes dada la observación. Observe que el producto de la densidad de la junta es solo de . No creo que deba obtener una fórmula actualizada secuencialmente aquí, solo una fórmula única para la p posterior ( ( μ , α ) ti=2..11 . p((μ,α)t|Y)
ely

El "multivariado" en el no está en contradicción con el "univariado" en las densidades de datos, porque son densidades en los y i 's. p(α,μ)yi
Xi'an

Respuestas:


7

La pista que estaba en mi respuesta a la respuesta anterior es ver cómo integré los parámetros, porque aquí harás exactamente las mismas integrales. Su pregunta asume los parámetros de varianza conocidos, por lo que son constantes. Solo necesita observar la dependencia del numerador. Para ver esto, tenga en cuenta que podemos escribir:α,μ

= 1

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

Observe cómo podemos extraer el primer factor fuera de la integral doble en el denominador, y se cancela con el numerador. También podemos extraer la suma de cuadradosexp [ -11(2πσe2)52πσp2y también se cancelará. La integral que nos queda es ahora (después de expandir el término al cuadrado):exp[12σe2i=211Yi2]

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Ahora podemos usar un resultado general del pdf normal.

Esto se deduce de completar el cuadrado en-az2+bzy observar quecno depende dez. Tenga en cuenta que la integral interna sobreμes de esta forma cona=10

exp(az2+bzc)dz=πaexp(b24ac)
az2+bzczμ yb= 11 i = 2 Yi-α 10 i = 1 Yia=102σe2+12σp2 yc=α2 10 i = 1 Y 2 ib=i=211Yiαi=110Yiσe2 . Después de hacer esta integral, encontrará que la integral restante sobreαtambién es de esta forma, por lo que puede usar esta fórmula nuevamente, con una diferentea,b,c. Entonces deberías poder escribir tu posterior en la forma1c=α2i=110Yi22αi=211YiYi12σe2+α22σp2αa,b,cdondeVes un2×2matriz12π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T]V2×2

Avísame si necesitas más pistas.

actualizar

(nota: fórmula correcta, debe ser lugar de μ 2 )10μ2μ2

5L5μ^,α^,Q11,Q12=Q21,Q22(μμ^,αα^)Q(μμ^,αα^)t

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

A=Q11,B=2Q12,C=Q22α^,μ^Q

(2ABB2C)(μ^α^)=(JK)

Por lo tanto, las estimaciones están dadas por:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

4ACB2

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Tenga en cuenta que si definimos para i = 2 , , 11 y tomamos el límite σ 2Xi=Yi1i=2,,11σp2μ,αα^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2μ^=Y¯α^X¯Y¯=110i=211YiX¯=110i=211Xi=110i=110Yi(0,0)


Esto no es particularmente útil porque mencioné específicamente que no es el denominador lo que importa aquí. El denominador es solo una constante de normalización, que será obvio una vez que reduzca el numerador a una forma gaussiana. Entonces, los trucos para evaluar las integrales en el denominador son matemáticamente geniales, pero simplemente no son necesarios para mi aplicación. El único problema con el que necesito resolución es manipular el numerador.
ely

(α,μ)
Xi'an

@ems: al calcular la constante de normalización, construirá la forma cuadrática requerida. contendrá los términos necesarios para compilar el cuadrado
probabilistico

(μ^,α^)t

Muchas gracias por la adición detallada. Estaba cometiendo algunos errores tontos cuando intentaba hacer el álgebra para descubrir la forma cuadrática. Sus comentarios sobre la relación con el estimador OLS son muy interesantes y apreciados también. Creo que esto acelerará mi código porque podré extraer muestras de una forma analítica que tenga métodos integrados y optimizados. Mi plan original era usar Metropolis-Hastings para probar esto, pero fue muy lento. ¡Gracias!
ely
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.