Esas dos distribuciones son diferentes para cada .n≥4
Notación
Voy a reescalar su simplex por un factor , para que los puntos de la red tengan coordenadas enteras. Esto no cambia nada, solo creo que hace que la notación sea un poco menos engorrosa.n
Sea el simple ( n - 1 ) , dado como el casco convexo de los puntos ( n , 0 , ... , 0 ) , ..., ( 0 , ... , 0 , n ) en R n . En otras palabras, estos son los puntos donde todas las coordenadas son no negativas, y donde las coordenadas suman n .S(n−1)(n,0,…,0)(0,…,0,n)Rnn
Deje denotar el conjunto de puntos de la red , es decir, aquellos puntos en S donde todas las coordenadas son integrales.ΛS
Si es un punto reticular, dejamos que V P denote su celda Voronoi , definida como aquellos puntos en S que están (estrictamente) más cerca de P que de cualquier otro punto en Λ .PVPSPΛ
Ponemos dos distribuciones de probabilidad que podemos poner en . Una de ellas es la distribución multinomial, donde el punto ( un 1 , . . . , Un n ) tiene la probabilidad de 2 - n n ! / ( a 1 ! ⋯ a n ! ) . El otro que llamaremos el modelo de Dirichlet , y se asigna a cada P ∈ lambda una probabilidad proporcional al volumen de V P .Λ(a1,...,an)2−nn!/(a1!⋯an!)P∈ΛVP
Justificación muy informal.
Estoy afirmando que el modelo multinomial y el modelo de Dirichlet dan diferentes distribuciones en , siempre que n ≥ 4 .Λn≥4
Para ver esto, considere el caso , y los puntos A = ( 2 , 2 , 0 , 0 ) y B = ( 3 , 1 , 0 , 0 ) . Afirmo que V A y V B son congruentes a través de una traducción del vector ( 1 , - 1 , 0 , 0 ) . Esto significa que V A y V Bn=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,−1,0,0)VAVBtienen el mismo volumen y, por lo tanto, que y B tienen la misma probabilidad en el modelo de Dirichlet. Por otro lado, en el modelo multinomial, tienen diferentes probabilidades ( 2 - 4 ⋅ 4 ! / ( 2 ! 2 ! ) Y 2 - 4 ⋅ 4 ! / 3 ! ), Y se deduce que las distribuciones no pueden ser iguales.AB2−4⋅4!/(2!2!)2−4⋅4!/3!
El hecho de que y V B sean congruentes se deduce de la siguiente afirmación plausible pero no obvia (y algo vaga):VAVB
Reclamo plausible : La forma y el tamaño de solo se ven afectados por los "vecinos inmediatos" de P (es decir, aquellos puntos en Λ que difieren de P por un vector que se parece a ( 1 , - 1 , 0 , ... , 0 ) , donde el 1 y - 1 pueden estar en otros lugares)VPPΛP(1,−1,0,…,0)1−1
Es fácil ver que las configuraciones de "vecinos inmediatos" de y B son las mismas, y luego se deduce que V A y V B son congruentes.ABVAVB
En el caso , podemos jugar el mismo juego, con A = ( 2 , 2 , n - 4 , 0 , … , 0 ) y B = ( 3 , 1 , n - 4 , 0 , … , 0 ) , por ejemplo.n≥5A=(2,2,n−4,0,…,0)B=(3,1,n−4,0,…,0)
No creo que esta afirmación sea completamente obvia, y no voy a demostrarlo, en lugar de una estrategia ligeramente diferente. Sin embargo, creo que esta es una respuesta más intuitiva de por qué las distribuciones son diferentes para .n≥4
Prueba rigurosa
Tome y B como en la justificación informal anterior. Solo necesitamos demostrar que V A y V B son congruentes.ABVAVB
Dado , definiremos W P de la siguiente manera: W P es el conjunto de puntos ( x 1 , ... , x n ) ∈ S , para el cual max 1 ≤ i ≤ n ( a i - p i ) - min 1 ≤ i ≤ n ( a iP=(p1,…,pn)∈ΛWPWP(x1,…,xn)∈S . (De una manera más digerible: Sea v i = a i - p i . W P es el conjunto de puntos para los cuales la diferencia entre v i más alto y más bajoes menor que 1.)max1≤i≤n(ai−pi)−min1≤i≤n(ai−pi)<1vi=ai−piWPvi
Vamos a demostrar que .VP=WP
Paso 1
Reclamación: .VP⊆WP
Esto es bastante fácil: Supongamos que no es en W P . Sea v i = x i - p i , y suponga (sin pérdida de generalidad) que v 1 = max 1 ≤ i ≤ n v i , v 2 = min 1 ≤ i ≤ n v i . v 1 - v 2X=(x1,…,xn)WPvi=xi−piv1=max1≤i≤nviv2=min1≤i≤nvi Como ∑ n i = 1 v i = 0 , también sabemos que v 1 > 0 > v 2 .v1−v2≥1∑ni=1vi=0v1>0>v2
Sea ahora . Dado que P y X tienen coordenadas no negativas, Q también lo tiene , y se deduce que Q ∈ S , y entonces Q ∈ Λ . Por otro lado, d i s t 2 ( X , P ) - d i s t 2Q=(p1+1,p2−1,p3,…,pn)PXQQ∈SQ∈Λ . De este modo, X es al menos tan cerca de Q como para P , por lo que X ∉ V P . Esto muestra (al tomar complementos) quedist2(X,P)−dist2(X,Q)=v21+v22−(1−v1)2−(1+v2)2=−2+2(v1−v2)≥0XQPX∉VP .Vp⊆WP
Paso 2
Reclamación : Los son separados por pares.WP
Supongamos lo contrario. Deje que y Q = ( q 1 , ... , q n ) ser puntos distintos en Λ , y dejar que X ∈ W P ∩ W Q . Como P y Q son distintos y ambos en Λ , debe haber un índice i donde p i ≥ q i + 1 , y uno dondeP=(p1,…,pn)Q=(q1,…,qn)ΛX∈WP∩WQPQΛipi≥qi+1 . Sin pérdida de generalidad, suponemos que p 1 ≥ q 1 + 1 y p 2 ≤ q 2 - 1 . Reorganizando y sumando, obtenemos q 1 - p 1 + p 2 - q 2 ≥ 2 .pi≤qi−1p1≥q1+1p2≤q2−1q1−p1+p2−q2≥2
Considere ahora los números y x 2 . Por el hecho de que X ∈ W P , tenemos x 1 - p 1 - ( x 2 - p 2 ) < 1 . Del mismo modo, X ∈ W Q implica que x 2 - q 2 - ( x 1 - q 1 ) < 1 . Sumando estos, obtenemos q 1 - px1x2X∈WPx1−p1−(x2−p2)<1X∈WQx2−q2−(x1−q1)<1 , y tenemos una contradicción.q1−p1+p2−q2<2
Paso 3
Hemos demostrado que , y que los W P son disjuntos. El V P cubre S hasta un conjunto de medida cero, y se deduce que W P = V P (hasta un conjunto de medida cero). [Dado que W P y V P están abiertos, en realidad tenemos W P = V P exactamente, pero esto no es esencial.]VP⊆WPWPVPSWP=VPWPVPWP=VP
Ahora, casi hemos terminado. Considere los puntos y B = ( 3 , 1 , n - 4 , 0 , … , 0 ) . Es fácil ver que W A y W B son congruentes y traducciones entre sí: la única forma en que podrían diferir es si el límite de S (que no sean las caras en las que AA=(2,2,n−4,0,…,0)B=(3,1,n−4,0,…,0)WAWBSAy ambos mienten) `` cortarían '' W A o W B pero no el otro. Pero para alcanzar esa parte del límite de S , tendríamos que cambiar una coordenada de A o B por al menos 1, lo que sería suficiente para garantizar que nos saque de W A y W B de todos modos. Por lo tanto, a pesar de que S se ve diferente de los puntos estratégicos A y B , las diferencias están demasiado lejos para ser captadas por las definiciones de W A y W B , y por lo tanto WBWAWBSABWAWBSABWAWB y W B son congruentes.WAWB
Entonces se deduce que y V B tienen el mismo volumen y, por lo tanto, el modelo de Dirichlet les asigna la misma probabilidad, a pesar de que tienen diferentes probabilidades en el modelo multinomial.VAVB