Para responder a su primera pregunta, solo necesitamos usar el Teorema de Bayes para actualizar nuestra probabilidad binomial con la versión beta anterior. Para comprender mejor cómo hacer esto, primero observe el siguiente resultado
p(θ|x)=p(x|θ)p(θ)∫Θp(x|θ)p(θ)dθ∝p(x|θ)p(θ)
donde podemos hacer uso del resultado de proporcionalidad ya que la distribución beta es el conjugado anterior para la probabilidad binomial.
Ahora deja xi∼Binomial(Ni,θ) y θ∼Beta(α,β). Ahora podemos usar el Teorema de Bayes para calcular el posterior de la siguiente manera:
p(θ|x)∝p(x|θ)p(θ)∝(Nxi)θs(1−θ)N−sΓ(α+β)Γ(α)Γ(β)θα−1(1−θ)β−1∝θs(1−θ)N−sθα−1(1−θ)β−1∝θα+s−1(1−θ)β+N−s−1
donde y
s=∑ni=1xiN=∑ni=1Ni
Ahora, reconocemos el lado derecho proporcional de la ecuación como el núcleo de otra distribución beta con parámetros actualizados
y
α∗=α+∑i=1nxi
β∗=β+∑i=1nNi−∑i=1nxi
Ahora, para la segunda parte de su problema, considere los siguientes gráficos de los posteriores dados distribuciones anteriores diferentes.
La gráfica anterior es de cinco distribuciones anteriores diferentes:
Prior 1Prior 1Prior 1Prior 1Prior 1:θ∼Beta(.5,.5):θ∼Beta(5,1):θ∼Beta(1,3):θ∼Beta(2,2):θ∼Beta(2,5)
Ahora, aunque la distribución posterior no parece cambiar mucho por la elección de previo en esta situación, este no es siempre el caso. Por ejemplo, si hubiéramos tomado una muestra de una distribución binomial (en el código) donde , veríamos que la distribución posterior cambia drásticamente por la elección de la distribución previa.N=2
Aquí está el R
código utilizado para generar todo:
colors = c("red","blue","green","orange","purple")
n = 10
N = 10
theta = .2
x = rbinom(n,N,theta)
grid = seq(0,2,.01)
alpha = c(.5,5,1,2,2)
beta = c(.5,1,3,2,5)
plot(grid,grid,type="n",xlim=c(0,1),ylim=c(0,4),xlab="",ylab="Prior Density",
main="Prior Distributions", las=1)
for(i in 1:length(alpha)){
prior = dbeta(grid,alpha[i],beta[i])
lines(grid,prior,col=colors[i],lwd=2)
}
legend("topleft", legend=c("Beta(0.5,0.5)", "Beta(5,1)", "Beta(1,3)", "Beta(2,2)", "Beta(2,5)"),
lwd=rep(2,5), col=colors, bty="n", ncol=3)
for(i in 1:length(alpha)){
dev.new()
plot(grid,grid,,type="n",xlim=c(0,1),ylim=c(0,10),xlab="",ylab="Density",xaxs="i",yaxs="i",
main="Prior and Posterior Distribution")
alpha.star = alpha[i] + sum(x)
beta.star = beta[i] + n*N - sum(x)
prior = dbeta(grid,alpha[i],beta[i])
post = dbeta(grid,alpha.star,beta.star)
lines(grid,post,lwd=2)
lines(grid,prior,col=colors[i],lwd=2)
legend("topright",c("Prior","Posterior"),col=c(colors[i],"black"),lwd=2)
}