Ya hay varias buenas respuestas, pero quizás esto pueda agregar algo nuevo ...
Siempre pienso en la regla de Bayes en términos de las probabilidades de los componentes, que se pueden entender geométricamente en términos de los eventos y B como se muestra a continuación.UNsi
Las probabilidades marginales y P ( B ) están dadas por las áreas de los círculos correspondientes. Todos los resultados posibles están representados por P ( A ∪ B ) = 1 , correspondiente al conjunto de eventos " A o B ". La probabilidad conjunta P ( A ∩ B ) corresponde al evento " A y B ".PAG( A )PAG( B )PAG( A ∪ B ) = 1UNsi PAG( A ∩ B )UNsi
En este marco, las probabilidades condicionales en el teorema de Bayes pueden entenderse como razones de áreas. La probabilidad de dado B es la fracción de B ocupada por A ∩ B , expresada como
P ( A | B ) = P ( A ∩ B )UNsisiA ∩ B
De manera similar, la probabilidad de queB seaAdadaes la fracción deAocupada porA∩B, es decir,
P(B|A)=P(A∩B)
PAG( A | B ) = P( A ∩ B )PAG( B )
siUNUNA ∩ BPAG( B | A ) = P( A ∩ B )PAG( A )
El teorema de Bayes es realmente solo una consecuencia matemática de las definiciones anteriores, que se pueden reexpresar como
Encuentro esto simétrico forma del teorema de Bayes para que sea mucho más fácil de recordar. Es decir, la identidad se mantiene independientemente de qué p ( A ) o p ( B ) se etiquete como "anterior" frente a "posterior".
PAG( B | A ) P( A ) = P( A ∩ B ) = P( A | B ) P( B )
p ( A )p ( B )
(Otra forma de entender la discusión anterior se da en mi respuesta a esta pregunta , desde un punto de vista más de "hoja de cálculo contable").