Encontré este artículo donde dice que en el muestreo de Gibbs se acepta cada muestra. Estoy un poco confundido. ¿Cómo es que si cada muestra que aceptaba converge a una distribución estacionaria?
En general, el algoritmo Metropolis aceptamos como min (1, p (x *) / p (x)) donde x * es el punto de muestra. Supongo que x * nos señala a una posición donde la densidad es alta, por lo que nos estamos moviendo a la distribución objetivo. Por lo tanto, supongo que se mueve a la distribución de destino después de un período de grabación.
Sin embargo, en el muestreo de Gibbs aceptamos todo, por lo que, aunque puede llevarnos a un lugar diferente, ¿cómo podemos decir que converge a la distribución estacionaria / objetivo?
Supongamos que tenemos una distribución . No podemos calcular Z. En el algoritmo de metrópolis utilizamos el término c ( θ n e w ) / c ( θ o l d ) para incorporar la distribución c ( θ ) más la constante de normalización Z cancela. Entonces está bien
Pero en el muestreo de Gibbs, ¿dónde estamos usando la distribución
Por ejemplo, en el documento http://books.nips.cc/papers/files/nips25/NIPS2012_0921.pdf se da
así que no tenemos la distribución condicional exacta de la que tomar muestras, solo tenemos algo que es directamente proporcional a la distribución condicional