Básicamente, solo dibuje un diagrama de Venn de dos círculos superpuestos que se supone que representan conjuntos de eventos. Llámalos A y B. Ahora la intersección de los dos es P (A, B), que se puede leer la probabilidad de A y B. Por las reglas básicas de probabilidad, P (A, B) = P (A | B) P (SI). Y dado que no hay nada especial en A versus B, también debe ser P (B | A) P (A). Igualar estos dos te da el teorema de Bayes.
El teorema de Bayes es realmente bastante simple. Las estadísticas bayesianas son más difíciles debido a dos razones. Una es que se necesita un poco de abstracción para pasar de hablar sobre roles aleatorios de dados a la probabilidad de que algún hecho sea Verdadero. Se requiere que tengas un previo y este previo afecta la probabilidad posterior que obtienes al final. Y cuando tiene que marginar muchos parámetros en el camino, es más difícil ver exactamente cómo se ve afectado.
Algunos encuentran que esto parece algo circular. Pero realmente, no hay forma de evitarlo. Los datos analizados con un modelo no lo llevan directamente a la Verdad. Nada lo hace. Simplemente le permite actualizar sus creencias de manera consistente.
La otra cosa difícil de las estadísticas bayesianas es que los cálculos se vuelven bastante difíciles, excepto por problemas simples, y es por eso que se recurre a todas las matemáticas para resolverlos. Necesitamos aprovechar cada simetría que podamos para facilitar los cálculos o recurrir a las simulaciones de Monte Carlo.
Entonces, las estadísticas bayesianas son difíciles, pero el teorema de Bayes realmente no lo es en absoluto. ¡No lo pienses más! Se sigue directamente del hecho de que el operador "Y", en un contexto probabilístico, es simétrico. A AND B es lo mismo que B AND A y todos parecen entender eso intuitivamente.