¿Esta cantidad relacionada con la independencia tiene un nombre?


18

Obviamente, los eventos A y B son independientes si Pr = Pr Pr . Definamos una cantidad relacionada Q:( A ) ( B )(UNsi)(A)(B)

QPr(AB)Pr(A)Pr(B)

Entonces A y B son independientes si Q = 1 (suponiendo que el denominador es distinto de cero). ¿Q realmente tiene un nombre? Siento que se refiere a un concepto elemental que se me escapa en este momento y que me sentiré bastante tonto por siquiera preguntar esto.


1
Q=Pr(UNEl |si)Pr(UN)=Pr(siEl |UN)Pr(si)
Pr(UNEl |si)=QPr(UN)Pr(B|A)=QPr(B)

Este SE podría hacer algunas preguntas más "bastante tontas". Es muy intimidante, incluso para alguien que disfrutaba de las estadísticas básicas de nivel universitario. +1 por estupidez
nada101


1
Ir a "Probabilidad Migdal";)
Bitwise

1
@PiotrMigdal Gracias por la amable oferta. Preferiría ver tu propia respuesta. Tal vez incluya cómo se le ocurrió esta pregunta y cómo esa cantidad puede ser útil.

Respuestas:


14

Se observa la relación esperada (abreviatura: o / e ).

Citando una respuesta a Acerca de la probabilidad conjunta dividida por el producto de las probabilidades en Math.SE (señalado por Procrastinator ):

Luego, al menos en la literatura ambiental, médica y de ciencias de la vida, P (A∩B) / (P (A) P (B)) se denomina relación observada a esperada (abreviatura o / e). La idea es que el numerador es la probabilidad real de A∩B mientras que el denominador es lo que sería si A y B fueran independientes.


11

Creo que estás buscando Lift(o mejora). La elevación es la razón de la probabilidad de que A y B ocurran juntos al múltiplo de las dos probabilidades individuales para A y B. Se utiliza para interpretar la importancia de una regla en la minería de reglas de asociación . Lift es una forma de medir cuánto mejor es un modelo sobre el punto de referencia y se define como la confianza dividida por el punto de referencia, donde cualquier valor que sea mayor que uno sugiere que la regla tiene cierta utilidad. Vea esta página también como otro ejemplo.


(+1) Buena respuesta. La viñeta Arules también tiene algunas buenas referencias sobre el ascensor .
chl

Gracias, eso es probablemente donde lo he visto antes. Sin embargo, creo que he visto levantar con una definición ligeramente diferente en el contexto de aprendizaje automático antes ... Odio que a veces haya una falta de consenso sobre una definición, mientras que otras veces hay muchos términos para el mismo concepto.
Michael McGowan

8

El análisis de correspondencia popular llama a una de estas cantidades una relación de contingencia , en el contexto de recuentos de tablas cruzadas. Las distancias de múltiples proporciones de este tipo a partir de 1 son las que visualizan los biplots. Véase, por ejemplo, Greenacre (1993) cap.13.

La gente de la selección de características de aprendizaje automático de la vieja escuela llama al registro de esta cantidad información mutua puntual . Ver, por ejemplo, Manning y Schütze (1999) p.66.


Gracias por señalar "índice de contingencia" e "información mutua puntual".
Piotr Migdal


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.