Teorema de Bayes Intuición


22

He estado tratando de desarrollar una comprensión basada en la intuición del teorema de Bayes en términos de la probabilidad anterior , posterior , de probabilidad y marginal . Para eso utilizo la siguiente ecuación: donde representa una hipótesis o creencia y representa datos o evidencia. He entendido el concepto de posterior : es una entidad unificadora que combina la creencia previa y la probabilidad de un evento. Lo que no entiendo es ¿qué significa la probabilidad ? ¿Y por qué es marginal AB

PAG(siEl |UN)=PAG(UNEl |si)PAG(si)PAG(UN)
UNsi
probabilidad en el denominador?
Después de revisar un par de recursos, encontré esta cita:

La probabilidad es el peso del evento dado por la ocurrencia de ... es la probabilidad posterior del evento , dado que el evento ha ocurrido.A P ( B | A ) B AsiUNPAG(siEl |UN)siUN

Las 2 declaraciones anteriores me parecen idénticas, solo escritas de diferentes maneras. ¿Alguien puede explicar la diferencia entre los dos?


44
Tienes un error tipográfico (o un error). debe ser la "hipótesis o creencia", y A debe ser la "información o evidencia" en su formulación. siUN
gung - Restablece a Monica

1
vea mi respuesta en math.stackexchange.com/a/1943255/1505 así es como terminé entendiéndolo intuitivamente
Lyndon White

Respuestas:


27

Aunque hay cuatro componentes enumerados en la ley de Bayes, prefiero pensar en términos de tres componentes conceptuales:

PAG(siEl |UN)2=PAG(UNEl |si)PAG(UN)3PAG(si)1
  1. Lo anterior es lo que creía sobre antes de haber encontrado una información nueva y relevante (es decir, A ). si UN
  2. Lo posterior es lo que crees (o deberías, si eres racional) sobre después de haber encontrado una información nueva y relevante. si
  3. El cociente de la probabilidad dividido por la probabilidad marginal de la nueva pieza de información indexa el contenido informativo de la nueva información para sus creencias sobre . si

19

Ya hay varias buenas respuestas, pero quizás esto pueda agregar algo nuevo ...

Siempre pienso en la regla de Bayes en términos de las probabilidades de los componentes, que se pueden entender geométricamente en términos de los eventos y B como se muestra a continuación.Asi

Conjuntos de eventos

Las probabilidades marginales y P ( B ) están dadas por las áreas de los círculos correspondientes. Todos los resultados posibles están representados por P ( A B ) = 1 , correspondiente al conjunto de eventos " A o B ". La probabilidad conjunta P ( A B ) corresponde al evento " A y B ".PAG(UN)PAG(si)PAG(UNsi)=1UNsi PAG(UNsi)UNsi

En este marco, las probabilidades condicionales en el teorema de Bayes pueden entenderse como razones de áreas. La probabilidad de dado B es la fracción de B ocupada por A B , expresada como P ( A | B ) = P ( A B )UNsisiUNsi De manera similar, la probabilidad de queB seaAdadaes la fracción deAocupada porAB, es decir, P(B|A)=P(AB)

PAG(UNEl |si)=PAG(UNsi)PAG(si)
siUNUNUNsi
PAG(siEl |UN)=PAG(UNsi)PAG(UN)

El teorema de Bayes es realmente solo una consecuencia matemática de las definiciones anteriores, que se pueden reexpresar como Encuentro esto simétrico forma del teorema de Bayes para que sea mucho más fácil de recordar. Es decir, la identidad se mantiene independientemente de qué p ( A ) o p ( B ) se etiquete como "anterior" frente a "posterior".

PAG(siEl |UN)PAG(UN)=PAG(UNsi)=PAG(UNEl |si)PAG(si)
pag(UN)pag(si)

(Otra forma de entender la discusión anterior se da en mi respuesta a esta pregunta , desde un punto de vista más de "hoja de cálculo contable").


9

@gung tiene una gran respuesta. Añadiría un ejemplo para explicar la "iniciación" en un ejemplo del mundo real.

HUNmisi

Entonces la fórmula es

PAG(HEl |mi)=PAG(miEl |H)PAG(H)PAG(mi)

Tenga en cuenta que la misma fórmula se puede escribir como

PAG(HEl |mi)PAG(miEl |H)PAG(H)

PAG(miEl |H)PAG(H)PAG(mi)mi

H{0 0,1}

11000PAG(H=1)=0.001PAG(H=0 0)=0,999

PAG(HEl |mi)

mi{0 0,1}

PAG(mi=1El |H=0 0)PAG(mi=1El |H=1)

mi=1


PAG(H=0 0)0,999PAG(H=1)=0.001

1

Tenga en cuenta que la regla de Bayes es

PAG(unEl |si)=PAG(si,un)PAG(si)=PAG(si,un)PAG(si)PAG(un)PAG(un)

Tenga en cuenta la relación

PAG(si,un)PAG(si)PAG(un).

siUNPAG(si,un)=PAG(si)PAG(un)

Curiosamente, el registro de esta relación también está presente en la información mutua:

yo(UNEl |si)=un,siPAG(un,si)Iniciar sesiónPAG(si,un)PAG(si)PAG(un)


0

PAG(UN,si)

probabilidad = proporciones de fila posterior = proporciones de columna

El anterior y el marginal se definen de manera análoga, pero se basan en "totales" en lugar de una columna en particular

marginal = proporciones totales de fila anterior = proporciones totales de columna

Me parece que esto me ayuda.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.