¿Alguien ha resuelto el ejercicio 4.1 de PTLOS?


19

Esta un ejercicio determinado en Teoría de la Probabilidad: La lógica de la ciencia por Edwin Jaynes, 2003. Hay una solución parcial aquí . He ideado una solución parcial más general y me preguntaba si alguien más la ha resuelto. Esperaré un poco antes de publicar mi respuesta, para darle una oportunidad a los demás.

Bien, supongamos que tenemos hipótesis mutuamente excluyentes y exhaustivas, denotadas por . Además, supongamos que tenemos conjuntos de datos, denotados por D_j \; \; (j = 1, \ dots, m) . La razón de probabilidad para la i-ésima hipótesis viene dada por:nHi(i=1,,n)mDj(j=1,,m)

LR(Hi)=P(D1D2,Dm|Hi)P(D1D2,Dm|H¯i)

Tenga en cuenta que estas son probabilidades condicionales. Ahora suponga que dada la hipótesis i-ésima Hi los conjuntos de datos m son independientes, entonces tenemos:

P(D1D2,Dm|Hi)=j=1mP(Dj|Hi)(i=1,,n)Condition 1

Ahora sería bastante conveniente si el denominador también tuviera en cuenta esta situación, de modo que tengamos:

P(D1D2,Dm|H¯i)=j=1mP(Dj|H¯i)(i=1,,n)Condition 2

En este caso, la razón de probabilidad se dividirá en un producto de factores más pequeños para cada conjunto de datos, de modo que tenemos:

LR(Hi)=j=1mP(Dj|Hi)P(Dj|H¯i)

En este caso, cada conjunto de datos "votará por Hi " o "votará en contra de Hi " independientemente de cualquier otro conjunto de datos.

El ejercicio es para demostrar que si n>2 (más de dos hipótesis), no existe una forma no trivial en la que pueda ocurrir esta factorización. Es decir, si supone que la condición 1 y la condición 2 se cumplen, entonces a lo sumo uno de los factores:

PAG(re1El |Hyo)PAG(re1El |H¯yo)PAG(re2El |Hyo)PAG(re2El |H¯yo)...PAG(remetroEl |Hyo)PAG(remetroEl |H¯yo)
es diferente de 1 y, por lo tanto, solo 1 conjunto de datos contribuirá a la razón de probabilidad.

Personalmente, encontré este resultado bastante fascinante, porque básicamente muestra que la prueba de hipótesis múltiples no es más que una serie de pruebas de hipótesis binarias.


Estoy un poco confundido por el índice en ; is ? ¿O es ? Parece que debería ser lo último, pero no estoy seguro de por qué el subíndice. O tal vez me estoy perdiendo algo completamente diferente :)H¯yoH¯yo=argmaxhHyoPAG(re1,...remetroEl |h)H¯yo=argmaxh{H1,...,Hnorte}PAG(re1,...remetroEl |h)
JMS

@JMS - representa la declaración lógica " es falsa", o que una de las otras hipótesis es verdadera. Entonces, en "álgebra booleana" tenemos (porque la hipótesis son exclusivos y exhaustivos)Hi ¯ H iH1+H2++Hi-1+Hi+1++HnH¯yoHyoH¯yoH1+H2++Hyo-1+Hyo+1++Hnorte
probabilidadislogic

Siento que tiene que haber una solución más intuitiva que el álgebra dada en la solución parcial de Sanders. Si los datos son independientes dada cada una de las hipótesis, esto sigue siendo válido cuando se modifican los antecedentes de la hipótesis. Y de alguna manera, el resultado es que lo mismo debe aplicarse para la conclusión ...
charles.y.zheng

@charles: sé exactamente cómo te sientes. Pensé que podría derivarlo usando alguna inconsistencia cualitativa (Reductio ad absurdum), pero no pude hacerlo. Aunque podría extender las matemáticas de Sander. Y es la condición 2, que es "la dudosa" en términos de lo que significa el resultado.
probabilityislogic

@probabilityislogic "básicamente muestra que la prueba de hipótesis múltiples no es más que una serie de pruebas de hipótesis binarias". Por favor, ¿podría ampliar esta oración? Al leer la página 98 del libro de Jaynes, entiendo que puede reducir la prueba de a la prueba de contra la hipótesis del otro y luego normalizar de alguna manera para obtener el posterior para , pero no entiendo por qué esto seguiría de los resultados del ejercicio 4.1. H 1 H 1H1,...,HnorteH1H1
Martin Drozdik

Respuestas:


7

La razón por la que aceptamos eq. 4.28 (en el libro, su condición 1) fue que asumimos la probabilidad de que los datos una determinada hipótesis y la información de fondo es independiente, en otras palabras, para cualquier y con : XHunXD j i jreyorejyoj

PAG(reyoEl |rejHunX)=PAG(reyoEl |HunX)(1)
ecation inextensibilidad más allá del caso binario puede discutirse así: Si asumimos que eq .1 para ser verdad, ¿la ecuación 2 también es verdadera?

PAG(reyoEl |rejHun¯X)=?PAG(reyoEl |Hun¯X)(2)
Primero veamos el lado izquierdo de la ecuación 2, usando la regla de multiplicación:

n { H 1 ... H n } ¯ H a = b a H b P ( D i | D j

PAG(reyoEl |rejHun¯X)=PAG(reyorejHun¯El |X)PAG(rejHun¯El |X)(3)
Dado que las hipótesis se asumen mutuamente excluyentes y exhaustivas, podemos escribir: Entonces eq.3 se convierte en: Para el caso de que solo tengamos dos hipótesis, las sumas se eliminan (dado que solo hay un ), los términos iguales en el nominador y el denominador, ), cancele y eq.2 se demuestra correcto, ya quenorte{H1...Hnorte}
Hun¯=siunHsi
baP(DjHb|XHb=¯ H a {H1,H2,H3}P(Di|Dj¯ H 1 )P(DjH2|X)+
PAG(reyoEl |rejHun¯X)=siunPAG(reyoEl |rejHsiX)PAG(rejHsiEl |X)siunPAG(rejHsiEl |X)=siunPAG(reyoEl |HsiX)PAG(rejHsiEl |X)siunPAG(rejHsiEl |X)
siunPAG(rejHsiEl |XHsi=Hun¯ . Por lo tanto, la ecuación 4.29 puede derivarse de la ecuación 4.28 del libro. Pero cuando tenemos más de dos hipótesis, esto no sucede, por ejemplo, si tenemos tres hipótesis: , la ecuación anterior se convierte en: En otras palabras: La única forma en que esta ecuación puede producir eq.2 es que ambos denominadores son iguales a 1, es decir, ambas fracciones en el los denominadores deben ser iguales a cero. Pero eso es imposible.{H1,H2,H3} P(Di|Dj ¯ H 1 X)=
PAG(reyoEl |rejH1¯X)=PAG(reyoEl |H2X)PAG(rejH2El |X)+PAG(reyoEl |H3X)PAG(rejH3El |X)PAG(rejH2El |X)+PAG(rejH3El |X)
PAG(reyoEl |rejH1¯X)=PAG(reyoEl |H2X)1+PAG(rejH3El |X)PAG(rejH2El |X)+PAG(reyoEl |H3X)1+PAG(rejH2El |X)PAG(rejH3El |X)

1
Creo que la cuarta ecuación es incorrecta. Deberíamos tenerPAG(reyorejHsiEl |X)=PAG(reyoHsiEl |X)PAG(rejEl |HsiX)
probabilidadislogica

Muchas gracias probabilidad lógica, pude corregir la solución. ¿Que piensas ahora?
Astroboy

Simplemente no entiendo cómo dice Jaynes: "Aquellos que no distinguen entre independencia lógica e independencia causal suponen que (4.29) siempre es válido".
Astroboy 05 de

Creo que encontré la respuesta a mi último comentario: justo después de la oración anterior, Jaynes dice: "siempre que ningún ejerza una influencia física sobre ningún otro ". Entonces, esencialmente Jaynes dice que incluso si no tienen influencia física, hay una limitación lógica que no permite la generalización de más de dos hipótesis. D jreyorej
astroboy

Después de leer el texto nuevamente, siento que mi último comentario no fue una buena respuesta. Según tengo entendido ahora, Jayne quería decir: "Aquellos que no distinguen entre independencia lógica e independencia causal" argumentarían que se supone que y no tienen influencia física. Por lo tanto, tienen una independencia causal que para ellos implica independencia lógica sobre cualquier conjunto de hipótesis. Entonces encuentran que toda esta discusión no tiene sentido y simplemente proceden a generalizar el caso binario. D jDiDj
astroboy

1

Bien, así que en lugar de ir y volver a derivar la ecuación de Saunder (5), la expondré aquí. Las condiciones 1 y 2 implican la siguiente igualdad:

djk=P(Dj|Hk,I)

j=1metro(kyohkrejk)=(kyohk)metro-1(kyohkj=1metrorejk)
donde
rejk=PAG(rejEl |Hk,yo)hk=PAG(HkEl |yo)

Ahora podemos especializarnos en el caso (dos conjuntos de datos) tomando y volviendo a . Tenga en cuenta que estos dos conjuntos de datos aún satisfacen las condiciones 1 y 2, por lo que el resultado anterior también se aplica a ellos. Ahora expandiendo en el caso obtenemos:D ( 1 ) 1D 1 D ( 1 ) 2metro=2re1(1)re1 m = 2re2(1)re2re3...remetrometro=2

(kihkd1k)(lihld2l)=(kihk)(lihld1ld2l)

kilihkhld1kd2l=kilihkhld1ld2l

kilihkhld2l(d1kd1l)=0(i=1,,n)

El término se produce dos veces en la doble suma anteriormente, una vez cuando y , y una vez más cuando y . Esto ocurrirá siempre que . El coeficiente de cada término viene dado por y . Ahora, debido a que existen de estas ecuaciones, en realidad podemos eliminar de estas ecuaciones. Para ilustrar, tome , ahora esto significa que tenemos todas las condiciones excepto donde y . Ahora tomak = a l = b k = b l = a a , b i d 2 b - d 2 a i i i = 1 a = 1 ,(d1ad1b)k=al=bk=bl=aa,bid2bd2aiii=1a=1,b=2b=1,a=2i=3, y ahora podemos tener estas dos condiciones (tenga en cuenta que esto supone al menos tres hipótesis). Entonces la ecuación puede reescribirse como:

l>khkhl(d2ld2k)(d1kd1l)=0

Ahora, cada uno de los términos debe ser mayor que cero, de lo contrario estamos tratando con la hipótesis , y la respuesta puede reformularse en términos de . Por lo tanto, estos se pueden eliminar del conjunto de condiciones anterior:hin1<nn1

l>k(d2ld2k)(d1kd1l)=0

Por lo tanto, hay condiciones que deben cumplirse, y cada una de las condiciones implica una de las dos " ": que para o (pero no necesariamente ambos). Ahora tenemos un conjunto de todos los pares únicos para . Si tuviéramos que tomar de estos pares para uno de los , tendríamos todos los números en el conjunto y . Esto se debe a que el primer par tiene elementos, y cada par adicional trae al menos un elemento adicional al conjunto *n(n1)2djk=djlj=1j=2(k,l)rejk=rejlnorte-1j1,...,norterej1=rej2==rej,norte-1=rej,norte2

Pero tenga en cuenta que debido a que hay condiciones , debemos elegir al menos el número entero más pequeño mayor o igual que para uno de los o . Si entonces el número de términos elegidos es mayor que . Si o entonces debemos elegir exactamente términos. Esto implica que . Solo con dos hipótesis ( ) es donde esto no ocurre. Pero a partir de la última ecuación en el artículo de Saunder, esta condición de igualdad implica:norte(norte-1)212×norte(norte-1)2=norte(norte-1)4 4j=1j=2norte>4 4norte-1norte=4 4norte=3norte-1rej1=rej2==rej,norte-1=rej,nortenorte=2

PAG(rejEl |H¯yo)=kyorejkhkkyohk=rejyokyohkkyohk=rejyo=PAG(rejEl |Hyo)

Por lo tanto, en la razón de probabilidad tenemos:

P(D1(1)|Hi)P(D1(1)|H¯i)=P(D1|Hi)P(D1|H¯i)=1 ORP(D2(1)|Hi)P(D2(1)|H¯i)=P(D2D3,Dm|Hi)P(D2D3,Dm|H¯i)=1

Para completar la prueba, tenga en cuenta que si se cumple la segunda condición, el resultado ya está probado, y solo una relación puede ser diferente de 1. Si se cumple la primera condición, entonces podemos repetir el análisis anterior al volver a etiquetar y . Entonces tendríamos no contribuyendo, o siendo el único contribuyente. Entonces tendríamos un tercer reetiquetado cuando no contribuya, y así sucesivamente. Por lo tanto, solo un conjunto de datos puede contribuir a la razón de probabilidad cuando se cumplen la condición 1 y la condición 2, y hay más de dos hipótesis.D1(2)D2D2(2)D3,DmD1,D2D2D1D2

* NOTA: Un par adicional podría no traer nuevos términos, pero esto sería compensado por un par que trajo 2 nuevos términos. por ejemplo, tome como primer [+2], [+1] y [+0], pero el siguiente término debe tener para ambos . Esto agregará dos términos [+2]. Si entonces no necesitamos elegir más, pero para el "otro" debemos elegir los 3 pares que no son . Estos son y, por lo tanto, la igualdad se mantiene, porque todos los números están en el conjunto.dj1=dj2dj1=dj3dj2=dj3djk=djlk,l(1,2,3)n=4j(1,2),(2,3),(1,3)(1,4),(2,4),(3,4)(1,2,3,4)


Estoy empezando a dudar de la precisión de esta prueba. El resultado en las matemáticas de Saunders implica solo restricciones no lineales en . Esto hace que solo tenga grados de libertad en lugar de . Sin embargo, para llegar a las condiciones se requiere un argumento diferente. ndjkdjkn2nn(n1)2
probabilityislogic

0

Para el registro, aquí hay una prueba algo más extensa . También contiene información de fondo. Tal vez esto sea útil para otros que estudian el tema.

La idea principal de la prueba es mostrar que las condiciones 1 y 2 de Jaynes implican que para todos menos un conjunto de datos . Luego muestra que para todos estos conjuntos de datos, también tenemos Por lo tanto, tenemos para todos menos un conjunto de datos, La razón por la que quería incluir la prueba aquí es que algunos de los pasos involucrados no son del todo obvios, y uno debe tener cuidado de no usar nada más que las condiciones 1 y 2 y la regla del producto (como hacen implícitamente muchas de las otras pruebas). El enlace de arriba

PAG(remetrokEl |HyoX)=PAG(remetrokEl |X),
metrok=1,...,metro
PAG(remetrokEl |H¯yoX)=PAG(remetrokEl |X).
PAG(remetrokEl |HyoX)PAG(remetrokEl |H¯yoX)=PAG(remetrokEl |X)PAG(remetrokEl |X)=1)
incluye todos estos pasos en detalle. Está en mi Google Drive y me aseguraré de que permanezca accesible.


Bienvenido a Cross Validated . Gracias por su respuesta. ¿Puede editar su respuesta para expandirla, a fin de incluir los puntos principales del enlace que proporciona? Será más útil tanto para las personas que buscan en este sitio como en caso de que se rompa el enlace. Por cierto, aproveche la oportunidad de hacer el Tour , si aún no lo ha hecho. Consulte también algunos consejos sobre Cómo responder , sobre cómo formatear ayuda y sobre cómo escribir ecuaciones usando LaTeX / MathJax .
Ertxiem - reinstalar a Monica el

Gracias por tu comentario. Edité la publicación y bosquejé los pasos principales de la prueba.
Dennis
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.