La proporcionalidad se utiliza para simplificar el análisis.
El análisis bayesiano generalmente se realiza a través de una declaración aún más simple del teorema de Bayes, donde trabajamos solo en términos de proporcionalidad con respecto al parámetro de interés. Para un modelo IID estándar con densidad de muestreo podemos expresar esto como:f(X|θ)
p(θ|x)∝Lx(θ)⋅p(θ)Lx(θ)∝∏i=1nf(xi|θ).
Esta declaración de actualización bayesiana funciona en términos de proporcionalidad con respecto al parámetro . Utiliza dos simplificaciones de proporcionalidad: una en el uso de la función de probabilidad (proporcional a la densidad de muestreo) y otra en la posterior (proporcional al producto de probabilidad y anterior). Dado que el posterior es una función de densidad (en el caso continuo), la regla normativa establece la constante multiplicativa que se requiere para producir una densidad válida (es decir, para que se integre en uno).θ
El uso de este método de proporcionalidad tiene la ventaja de permitirnos ignorar los elementos multiplicativos de las funciones que no dependen del parámetro . Esto tiende a simplificar el problema al permitirnos barrer partes innecesarias de las matemáticas y obtener declaraciones más simples del mecanismo de actualización. Este no es un requisito matemática (ya que la regla de Bayes funciona en su forma no proporcional también), sino que hace las cosas más simples para nuestros diminutos cerebros animales.θ
Un ejemplo aplicado: considere un modelo IID con datos observados . Para facilitar nuestro análisis, definimos las estadísticas y , que son los dos primeros momentos de muestra. Para este modelo tenemos densidad de muestreo:X1,...,Xn∼IID N(θ,1)x¯=1n∑ni=1xix¯¯=1n∑ni=1x2i
f(x|θ)=∏i=1nf(xi|θ)=∏i=1nN(xi|θ,1)=∏i=1n12π−−√exp(−12(xi−θ)2)=(2π)n/2exp(−12∑i=1n(xi−θ)2).=(2π)n/2exp(−n2(θ2−2x¯θ+x¯¯))=(2π)n/2exp(−nx¯¯2)⋅exp(−n2(θ2−2x¯θ))
Ahora, podemos trabajar directamente con esta densidad de muestreo si queremos. Pero observe que los dos primeros términos en esta densidad son constantes multiplicativas que no dependen de . Es molesto tener que hacer un seguimiento de estos términos, así que vamos a deshacernos de ellos para tener la función de probabilidad:θ
Lx(θ)=exp(−n2(θ2−2x¯θ)).
Eso simplifica un poco las cosas, ya que no tenemos que hacer un seguimiento de un término adicional. Ahora, podríamos aplicar la regla de Bayes usando su versión de ecuación completa, incluido el denominador integral. Pero, de nuevo, esto requiere que hagamos un seguimiento de otra constante multiplicativa molesta que no depende de (más molesto porque tenemos que resolver una integral para obtenerla). Entonces, apliquemos la regla de Bayes en su forma proporcional. Usando el conjugado previo , con algún parámetro de precisión conocido , obtenemos el siguiente resultado ( completando el cuadrado ):θθ∼N(0,λ0)λ0>0
p(θ|x)∝Lx(θ)⋅p(θ)=exp(−n2(θ2−2x¯θ))⋅N(θ|0,λ0)∝exp(−n2(θ2−2x¯θ))⋅exp(−λ02θ2)=exp(−12(nθ2−2nx¯θ+λ0θ2))=exp(−12((n+λ0)θ2−2nx¯θ))=exp(−n+λ02(θ2−2nx¯n+λ0θ))∝exp(−n+λ02(θ−nn+λ0⋅x¯)2)∝N(θ∣∣nn+λ0⋅x¯,n+λ0).
Entonces, de este trabajo podemos ver que la distribución posterior es proporcional a una densidad normal. Como el posterior debe ser una densidad, esto implica que el posterior es esa densidad normal:
p(θ|x)=N(θ∣∣nn+λ0⋅x¯,n+λ0).
Por lo tanto, vemos que a posteriori el parámetro se distribuye normalmente con media posterior y varianza dada por:θ
E(θ|x)=nn+λ0⋅x¯V(θ|x)=1n+λ0.
Ahora, la distribución posterior que hemos derivado tiene una constante de integración en el frente (que podemos encontrar fácilmente al buscar la forma de la distribución normal ). Pero tenga en cuenta que no teníamos que preocuparnos por esta constante multiplicativa: todo nuestro trabajo eliminó (o introdujo) constantes multiplicativas siempre que esto simplificara las matemáticas. Se puede obtener el mismo resultado mientras se realiza un seguimiento de las constantes multiplicativas, pero esto es mucho más complicado.