La simple diferencia entre los dos es que la distribución posterior depende del parámetro desconocido θ , es decir, la distribución posterior es:
p ( θ | x ) = c × p ( x | θ ) p ( θ )
donde do es la constante de normalización .
Mientras que, por otro lado, la distribución predictiva posterior no depende del parámetro desconocido θ porque se ha integrado, es decir, la distribución predictiva posterior es:
p ( x∗El | x)= ∫Θc × p ( x∗, θ | x ) dθ = ∫Θc × p ( x∗El | θ)p(θ | x)dθ
X∗X
No me detendré en la explicación de la distribución posterior, ya que usted dice que la comprende, pero la distribución posterior "es la distribución de una cantidad desconocida, tratada como una variable aleatoria, condicional a la evidencia obtenida" (Wikipedia). Básicamente, es la distribución la que explica su parámetro desconocido, aleatorio.
Por otro lado, la distribución predictiva posterior tiene un significado completamente diferente en el sentido de que es la distribución de datos pronosticados en el futuro en función de los datos que ya ha visto. Entonces, la distribución predictiva posterior se usa básicamente para predecir nuevos valores de datos.
Si ayuda, es un gráfico de ejemplo de una distribución posterior y una distribución predictiva posterior: