Estaba revisando la documentación de Stan que se puede descargar desde aquí . Estaba particularmente interesado en su implementación del diagnóstico Gelman-Rubin. El artículo original Gelman y Rubin (1992) define el factor de reducción de escala potencial (PSRF) de la siguiente manera:
Deje que sea la ésima cadena de Markov muestreada, y que haya cadenas independientes independientes muestreadas. Sea la media de la ésima cadena, y sea la media general. Definir, donde Y defina B B = \ dfrac {N} {M-1} \ sum_ {m = 1} ^ {M} (\ bar {X} _ {m \ cdot} - \ bar {X} _ {\ cdot \ cdot }) ^ 2 \ ,. i M ˉ X i ⋅ i ˉ X ⋅ ⋅ W = 1s 2 m =1
Defina
La documentación de Stan en la página 349 ignora el término con y también elimina el término multiplicativo Esta es su fórmula,
El estimador de varianza es
Finalmente, la estadística de reducción de escala potencial se define por
Por lo que pude ver, no proporcionan una referencia para este cambio de fórmula, y tampoco lo discuten. Por lo general, no es demasiado grande, y a menudo puede ser tan bajo como , por lo que no debe ignorarse, incluso si el término se puede aproximar a 1.
Entonces, ¿de dónde viene esta fórmula?
EDITAR: He encontrado una respuesta parcial a la pregunta "¿de dónde viene esta fórmula? ", En que el libro Bayesian Data Analysis de Gelman, Carlin, Stern y Rubin (Segunda edición) tiene exactamente la misma fórmula. Sin embargo, el libro no explica cómo / por qué es justificable ignorar esos términos.