Hay una respuesta "teórica" y una respuesta "pragmática".
Desde un punto de vista teórico, cuando un prior es incorrecto, el posterior no existe (bueno, mire la respuesta de Matthew para una declaración más sólida), pero puede aproximarse por una forma limitante.
Si los datos comprenden una muestra condicionalmente iid de la distribución de Bernoulli con el parámetro , y tiene la distribución beta con los parámetros y , la distribución posterior de es la distribución beta con los parámetros ( observaciones, éxitos) y su media es . Si usamos la distribución beta inadecuada (e irreal) antes con los hiperamámetros anteriores , y pretendemos queθ α β θ α + s , β + n - s n s ( α +θθαβθα + s , β+ n - snortesα = β = 0 π ( θ ) ∝ θ - 1 ( 1( α + s ) / ( α + β+ n )α = β= 0 θ s - 1 ( 1 - θ ) n - sπ( θ ) ∝ θ- 1( 1 - θ )- 1, Obtenemos una posterior adecuada proporcional a , es decir, el pdf de la distribución beta con parámetros y a excepción de un factor constante. Esta es la forma limitante de la parte posterior para un beta anterior con los parámetros y (Degroot & Schervish, Ejemplo 7.3.13). sn-sα→0β→0θs - 1( 1 - θ )n - s - 1sn - sα → 0β→ 0
En un modelo normal con media , varianza conocida y una distribución para , si la precisión anterior, , es pequeño en relación con la precisión de los datos, , luego la distribución posterior es aproximadamente como si :
es decir, la distribución posterior es aproximadamente la que resultaría de suponer que es proporcional a una constante paraσ 2 N ( μ 0 , τ 2 0 ) θ 1 / τ 2 0 n / σ 2 τ 2 0 = ∞ p ( θ ∣ x ) ≈ N ( θ ∣ ˉ x , σ 2 / n ) p ( θ ) θ ∈ ( - ∞ , ∞ ) τ 2 0θσ2norte( μ0 0, τ20 0)θ1 / τ20 0n / σ2τ20 0= ∞
p ( θ ∣ x ) ≈ N( θ ∣ x¯, σ2/ n)
p ( θ )θ ∈ ( - ∞ , ∞ ), una distribución que no es estrictamente posible, pero la forma limitante de la parte posterior a medida que aproxima a existe (
Gelman et al. , p. 52).
τ20 0∞
Desde un punto de vista "pragmático", cuando
sea lo que sea , entonces si en
, luego . Se pueden emplear antecedentes inadecuados para representar el comportamiento local de la distribución previa en la región donde la probabilidad es apreciable, digamos . Suponiendo que, con una aproximación suficiente, un previo sigue formas como o solo sobrep ( x ∣ θ ) p ( θ ) = 0p ( x ∣ θ ) = 0p ( θ )p ( x ∣ θ ) ≠ 0( a , b )∫∞- ∞p ( x ∣ θ ) p ( θ ) dθ = ∫siunap ( x ∣ θ ) p ( θ ) dθ( a , b )F( x ) = k , x ∈ ( - ∞ , ∞ )F( x ) = k x- 1, x ∈ ( 0 , ∞ )( a , b ), que se reduce adecuadamente a cero fuera de ese rango, nos aseguramos de que los anteriores realmente utilizados sean correctos ( Box y Tiao , p. 21). Entonces, si la distribución previa de es pero
está limitada, es como si , es decir, . Para un ejemplo concreto, esto es lo que sucede en Stan : si no se especifica ningún previo para un parámetro, se le da implícitamente un previo uniforme en su soporte y esto se maneja como una multiplicación de la probabilidad por una constante.θU( - ∞ , ∞ )( a , b )θ ∼ U( a , b )p ( x ∣ θ ) p ( θ ) = p ( x ∣ θ ) k ∝ p ( x ∣ θ )