Cualquier probabilidad posterior es válida en este caso
Esta es una pregunta interesante, que se mete en el territorio de los fundamentos de la probabilidad. Aquí hay algunos enfoques posibles, pero por razones que explicaré más adelante, el enfoque que prefiero es dar una definición más amplia de probabilidad condicional que sea análoga a su definición cuando se trata de variables aleatorias continuas. (Los detalles de este método se muestran a continuación.) En este caso particular, esto lleva a la conclusión de que el Bayesiano puede tener cualquier creencia posterior sobreX, y esto produce un conjunto coherente de creencias (a pesar de que han observado un evento que creen que tiene probabilidad cero).
La ventaja de este enfoque es que proporciona una distribución posterior bien definida y permite a los bayesianos actualizar sus creencias condicionadas a observar un evento que se estipuló que ocurría con probabilidad cero. El posterior se actualiza esencialmente de manera arbitraria (cualquier probabilidad posterior es igualmente coherente), pero esa flexibilidad no es sorprendente dado lo que ha ocurrido. En este caso, diferentes bayesianos con las mismas creencias previas podrían llegar legítimamente a conclusiones posteriores diferentes, debido al hecho de que todos han observado un evento con probabilidad cero a priori .
Probabilidad condicional para variables aleatorias continuas: cuando se trata de variables aleatorias continuas, la función de probabilidad condicional se define a través de la derivada de Radon-Nikodym , y esencialmente solo requiere que la función satisfaga la ley de probabilidad conjunta. SiX y E fueron variables aleatorias continuas (en lugar de eventos discretos) en un espacio de probabilidad (Ω,G,P) entonces definiríamos la función de probabilidad condicional p(x|e) como cualquier función medible no negativa que satisfaga la ecuación integral:
p(x)=∫Ep(x|e) dP(e)for all x∈X∈G.
Ya que p(x) también se define a través de la derivada Radon-Nikodym, esto significa implícitamente que p(x|e) puede ser cualquier función medible no negativa que satisfaga la ecuación integral:
P(X∈A)=∫A∫Ep(x|e) dP(e) dxfor all A∈G.
Esto proporciona una solución no única para la función de probabilidad condicional, aunque en la práctica, cada solución es "casi segura" equivalente (es decir, difieren solo en un conjunto de resultados con probabilidad cero), por lo que no hay problema con la no unicidad .
Definición de probabilidad condicional para eventos discretos: La definición estándar de probabilidad condicional para eventos discretos es la fórmula de razón bien conocida, donde el denominador es la probabilidad del evento de condicionamiento. Obviamente, en el caso de que el evento de condicionamiento tenga probabilidad cero, este objeto no está definido. La solución obvia aquí es ampliar la definición de manera análoga al método utilizado en el caso continuo. Es decir, definimos el par de probabilidad condicionalP(X|E) y P(X|E¯) como cualquier par de valores entre cero y uno que satisfagan la ecuación:
P(X)=P(X|E)×P(E)+P(X|E¯)×(1−P(E)).
En el caso estipulado en la pregunta tenemos la creencia previa P(X)=1 y la distribución de muestreo P(E|X)=0, lo que lleva a P(E)=0. Sustituyendo estos valores en la ecuación anterior se obtiene:
1=P(X|E)×0+P(X|E¯)×1.
Podemos ver que esta ecuación se satisface tomando P(X|E¯)=1 y cualquier 0⩽P(X|E)⩽1. Por lo tanto, la probabilidad condicional (posterior) puede ser coherentemente cualquier valor entre cero y uno. Cuando decimos que esto es "coherente", simplemente queremos decir que la probabilidad posterior no es inconsistente con las otras probabilidades estipuladas en el problema (es decir, las probabilidades anteriores y de muestreo).P(X|E)
Por qué este enfoque tiene más sentido: es completamente posible que un análisis bayesiano pueda involucrar la observación de un evento discreto que tiene cero probabilidad estipulada en la distribución anterior. Por ejemplo, en un modelo estándar de lanzamiento de monedas, estipulamos una distribución de Bernoulli para el resultado de cara / cruz, pero es posible que la moneda descanse en su borde (por lo tanto, no es cara ni cruz). Los cerebros no deberían explotar en este caso y, por lo tanto, corresponde al razonamiento bayesiano tener una forma bien definida de proceder en este caso.
La principal ventaja del enfoque que he esbozado es que siempre conduce a al menos un valor permitido para la probabilidad posterior (es decir, la probabilidad posterior está bien definida ). La probabilidad posterior no está definida de manera única, pero eso es una consecuencia natural del hecho de que hay varios valores que son igualmente coherentes con la observación de muestreo de probabilidad cero. Este enfoque significa que el Bayesiano es libre de estipular cualquier probabilidad posterior, y esto es tan coherente como cualquier otro. (Tenga en cuenta que cuando decimos "coherente" aquí, estamos hablando de coherencia con una creencia previa que estipulaba probabilidad cero para un evento discreto que realmente sucedió, ¡por lo que la coherencia con eso no es una barra alta!)
Hay otro beneficio importante de este enfoque , que es que le permite al Bayesiano actualizar sus creencias en respuesta a la observación de un evento que tenía cero probabilidad de muestreo bajo el anterior, y en particular, el Bayesiano ahora puede revisar sus creencias. para que ya no atribuyan probabilidad cero a este evento . En el ejemplo que da, el Bayesiano tenía una creencia previa de que es cierto casi con certeza, luego compro un evento con probabilidad de muestreo cero condicional en este evento. Ahora el Bayesiano es libre de actualizar su creencia a una probabilidad posterior para que no es una (y, por lo tanto, una probabilidad posterior correspondiente paraXX X¯eso no es cero). Entonces, en esencia, el Bayesiano ahora puede decir "¡Oh, mierda! ¡Fue un tonto antes! ¡Permítanme actualizar mi creencia en ese evento para que ya no ocurra con mayor seguridad!" Además, este no es un cambio ad hoc , sino una actualización legítima "coherente" realizada bajo el teorema de Bayes.