Estoy trabajando en la derivación de un Normal-Wishart posterior, pero estoy atascado en uno de los parámetros (el posterior de la matriz de escala, ver en la parte inferior).
Solo por contexto e integridad, aquí está el modelo y el resto de las derivaciones:
xiμΛ∼N(μ,Λ)∼N(μ0,(κ0Λ)−1)∼W(υ0,W0)
Las formas ampliadas de cada uno de los tres factores son (hasta una constante de proporcionalidad) son:
Probabilidad:
N(xi|μ,Λ)∝|Λ|N/2exp(−12∑i=1N(xTiΛxi−2μTΛxi+μTΛμ))
Normal anterior:
N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp(−12(μTκ0Λμ−2μTκ0Λμ0+μT0κ0Λμ0))
Wishart anterior:
W(Λ|υ0,W0)∝|Λ|υ0−D−12exp(−12tr(W−10Λ))
Queremos el Normal-Wishart posterior ( ) que se puede descomponer como así como :μ,Λ|μ′,κ′,υ′,W′N(μ|μ,κ′Λ)W(Λ|υ′,W′)
Degreso de libertadυ′
Al fusionar los primeros factores de probabilidad y Wishart obtenemos el primer factor del factor Wishart en la parte posterior:
y, por lo tanto, tenemos el primer parámetro de la parte posterior:
|Λ|υ0+N−D−12
υ′=υ0+N
Factor de escalaκ′
Identificamos los elementos rodeados por y para encontrar quién es el actualizado por la probabilidad:
y, por lo tanto, obtuvimos el segundo parámetro:
μTμκ0Λ
μT((κ0+N)Λ)μ
κ′=κ0+N
Mediaμ′
El tercer parámetro proviene de identificar lo que está dentro de :
Y por lo tanto tenemos el tercer parámetro:
2μT...
2μT(ΛNx¯¯¯+κ0Λμ0)(ΛNx¯¯¯+κ0Λμ0)(Nx¯¯¯+κ0μ0)=2μTκ′Λμ′=κ′Λμ′=κ′μ′
μ′=1k′(Nx¯¯¯+κ0μ0)
Matriz de escalaW′
Y el cuarto parámetro proviene de trabajar en los parámetros restantes:
tr(W′−1Λ)=tr(W−10Λ)+∑i=1NxTiΛxi+μT0κ0Λμ0=tr(W−10Λ)+∑i=1Ntr(xTiΛxi)+tr(μT0κ0Λμ0)=tr(W−10Λ+∑i=1NxTiΛxi+μT0κ0Λμ0)
¿Cómo continuar desde aquí (si no cometí errores hasta el momento) y obtener la solución estándar para ?W′
Editar 1 :
Ahora reorganizamos los términos, sumamos y restamos algunos factores para obtener dos cuadrados como en la solución estándar:
tr(W′−1Λ)==tr(W−1Λ+∑i=1N(xTiΛxi+x¯¯¯TΛx¯¯¯−2xTiΛx¯¯¯)+κ0(μT0Λμ0+x¯¯¯TΛx¯¯¯−2x¯¯¯TΛμ0)−∑i=1Nx¯¯¯TΛx¯¯¯+2∑i=1NxTiΛx¯¯¯−κ0x¯¯¯TΛx¯¯¯+2κ0x¯¯¯TΛμ0)tr(W−1Λ+∑i=1N(xi−x¯¯¯)Λ(xi−x¯¯¯)T+κ0(x¯¯¯−μ0)Λ(x¯¯¯−μ0)T−Nx¯¯¯Λx¯¯¯T+2Nx¯¯¯Λx¯¯¯T−κ0x¯¯¯Λx¯¯¯T+2κ0x¯¯¯ΛμT0)
Simplificamos los factores que quedan fuera de los cuadrados:
tr(W′−1Λ)=tr(W−1Λ+∑i=1N(xi−x¯¯¯)TΛ(xi−x¯¯¯)+κ0(x¯¯¯−μ0)TΛ(x¯¯¯−μ0)+(N−κ0)x¯¯¯TΛx¯¯¯+2κ0x¯¯¯TΛμ0)
Edición 2 ( seguimiento gracias a la respuesta de @bdeonovic )
La traza es cíclica, por lo que . Entonces:
y luego:
tr(ABC)=tr(BCA)=tr(CAB)
tr(W′−1Λ)=tr(W−1Λ+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)TΛ+κ0(x¯¯¯−μ0)(x¯¯¯−μ0)TΛ+(N−κ0)x¯¯¯x¯¯¯TΛ+2κ0x¯¯¯μT0Λ)
tr(W′−1)=tr(W−1+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)T+κ0(x¯¯¯−μ0)(x¯¯¯−μ0)T+(N−κ0)x¯¯¯x¯¯¯T+2κ0x¯¯¯μT0)
¡Casi! Pero aún no está allí. El objetivo es:
W−1+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)T+κ0Nκ0+N(x¯¯¯−μ0)(x¯¯¯−μ0)T