Bien, así que en lugar de ir y volver a derivar la ecuación de Saunder (5), la expondré aquí. Las condiciones 1 y 2 implican la siguiente igualdad:
djk=P(Dj|Hk,I)
∏j = 1metro( ∑k ≠ ihkrej k) = ( ∑k ≠ ihk)m - 1( ∑k ≠ ihk∏j = 1metrorej k)
donde
rej k= P( DjEl | Hk, I)hk= P( HkEl | yo)
Ahora podemos especializarnos en el caso (dos conjuntos de datos) tomando y volviendo a . Tenga en cuenta que estos dos conjuntos de datos aún satisfacen las condiciones 1 y 2, por lo que el resultado anterior también se aplica a ellos. Ahora expandiendo en el caso obtenemos:D ( 1 ) 1 ≡ D 1 D ( 1 ) 2m = 2re( 1 )1≡ D1 m = 2re( 1 )2≡ D2re3... Dmetrom = 2
( ∑k ≠ ihkre1 k)(∑l≠ihld2l)=(∑k≠ihk)(∑l≠ihld1ld2l)
→∑k≠i∑l≠ihkhld1kd2l=∑k≠i∑l≠ihkhld1ld2l
→∑k≠i∑l≠ihkhld2l(d1k−d1l)=0(i=1,…,n)
El término se produce dos veces en la doble suma anteriormente, una vez cuando y , y una vez más cuando y . Esto ocurrirá siempre que . El coeficiente de cada término viene dado por y . Ahora, debido a que existen de estas ecuaciones, en realidad podemos eliminar de estas ecuaciones. Para ilustrar, tome , ahora esto significa que tenemos todas las condiciones excepto donde y . Ahora tomak = a l = b k = b l = a a , b ≠ i d 2 b - d 2 a i i i = 1 a = 1 ,(d1a−d1b)k=al=bk=bl=aa,b≠id2b−d2aiii=1a=1,b=2b=1,a=2i=3, y ahora podemos tener estas dos condiciones (tenga en cuenta que esto supone al menos tres hipótesis). Entonces la ecuación puede reescribirse como:
∑l>khkhl(d2l−d2k)(d1k−d1l)=0
Ahora, cada uno de los términos debe ser mayor que cero, de lo contrario estamos tratando con la hipótesis , y la respuesta puede reformularse en términos de . Por lo tanto, estos se pueden eliminar del conjunto de condiciones anterior:hin1<nn1
∑l>k(d2l−d2k)(d1k−d1l)=0
Por lo tanto, hay condiciones que deben cumplirse, y cada una de las condiciones implica una de las dos " ": que para o (pero no necesariamente ambos). Ahora tenemos un conjunto de todos los pares únicos para . Si tuviéramos que tomar de estos pares para uno de los , tendríamos todos los números en el conjunto y . Esto se debe a que el primer par tiene elementos, y cada par adicional trae al menos un elemento adicional al conjunto *n(n−1)2djk=dj lj = 1j = 2( k , l )rej k= dj ln - 1j1 , ... , nrej 1= dj 2= ⋯ = dj , n - 1= dj , n2
Pero tenga en cuenta que debido a que hay condiciones , debemos elegir al menos el número entero más pequeño mayor o igual que para uno de los o . Si entonces el número de términos elegidos es mayor que . Si o entonces debemos elegir exactamente términos. Esto implica que . Solo con dos hipótesis ( ) es donde esto no ocurre. Pero a partir de la última ecuación en el artículo de Saunder, esta condición de igualdad implica:n ( n - 1 )212× n ( n - 1 )2= n ( n - 1 )4 4j = 1j = 2n > 4n - 1n = 4n = 3n - 1rej 1= dj 2= ⋯ = dj , n - 1= dj , nn = 2
PAG( DjEl | H¯¯¯¯¯yo) = ∑k ≠ irej khk∑k ≠ ihk= dj i∑k ≠ ihk∑k ≠ ihk= dj i=P( DjEl | Hyo)
Por lo tanto, en la razón de probabilidad tenemos:
P(D(1)1|Hi)P(D(1)1|H¯¯¯¯¯i)=P(D1|Hi)P(D1|H¯¯¯¯¯i)=1 ORP(D(1)2|Hi)P(D(1)2|H¯¯¯¯¯i)=P(D2D3…,Dm|Hi)P(D2D3…,Dm|H¯¯¯¯¯i)=1
Para completar la prueba, tenga en cuenta que si se cumple la segunda condición, el resultado ya está probado, y solo una relación puede ser diferente de 1. Si se cumple la primera condición, entonces podemos repetir el análisis anterior al volver a etiquetar y . Entonces tendríamos no contribuyendo, o siendo el único contribuyente. Entonces tendríamos un tercer reetiquetado cuando no contribuya, y así sucesivamente. Por lo tanto, solo un conjunto de datos puede contribuir a la razón de probabilidad cuando se cumplen la condición 1 y la condición 2, y hay más de dos hipótesis.D(2)1≡D2D(2)2≡D3…,DmD1,D2D2D1D2
* NOTA: Un par adicional podría no traer nuevos términos, pero esto sería compensado por un par que trajo 2 nuevos términos. por ejemplo, tome como primer [+2], [+1] y [+0], pero el siguiente término debe tener para ambos . Esto agregará dos términos [+2]. Si entonces no necesitamos elegir más, pero para el "otro" debemos elegir los 3 pares que no son . Estos son y, por lo tanto, la igualdad se mantiene, porque todos los números están en el conjunto.dj1=dj2dj1=dj3dj2=dj3djk=djlk,l∉(1,2,3)n=4j(1,2),(2,3),(1,3)(1,4),(2,4),(3,4)(1,2,3,4)