Este tipo de problema se estudió en el documento
"Aumento de datos en tablas de contingencia de múltiples vías con totales marginales fijos" de Dobra et al (2006). Supongamos que denota los parámetros del modelo, que n denota la tabla de recuentos enteros no observados para cada par ( x , y ) , y que C ( S , T ) es el conjunto de tablas de enteros cuyos recuentos marginales son iguales ( S , T ) . Entonces la probabilidad de observar los recuentos marginales ( S , T ) es:
p (θnorte( x , y)C( S, T)( S, T)( S, T)
donde p ( n | θ ) es la distribución de muestreo multinomial. Esto define la función de probabilidad para ML, pero la evaluación directa no es factible excepto por pequeños problemas. El enfoque que recomiendan es MCMC, donde puede actualizar alternativamente n y θ
p ( S, TEl | θ)= ∑n ∈C( S, T)p ( n | θ )
p ( n | θ )norteθtomando muestras de una distribución de propuesta y aceptando el cambio de acuerdo con el índice de aceptación de Metropolis-Hastings. Esto podría adaptarse para encontrar un máximo aproximado sobre
usando Monte Carlo EM.
θ
Un enfoque diferente usaría métodos variacionales para aproximar la suma sobre . Las restricciones marginales pueden codificarse como un gráfico de factores y la inferencia sobre θ podría llevarse a cabo utilizando la propagación de expectativas.norteθ
Para ver por qué este problema es difícil y no admite una solución trivial, considere el caso . Tomando S como las sumas de las filas y T como las sumas de las columnas, hay dos posibles tablas de recuento:
[ 0 1 2 0 ]S= ( 1 , 2 ) , T= ( 2 , 1 )ST
Por lo tanto la función de probabilidad es
p(S,T | theta)=3 p 12 p 2 21 +6 p 11 p 21 p 22
El MLE para este problema es
p x , Y = [ 0 1 / 3 2 / 3 0 ]
[ 0210 0][ 110 01]
p ( S, TEl | θ)=3 p12pag221+ 6 p11pag21pag22
pag^x , y= [ 02 / 31 / 30 0]
que corresponde a asumir la tabla de la izquierda. Por el contrario, la estimación que se podrían obtener por supuesto de independencia es
que tiene un valor de probabilidad menor.
qx , y= [ 1 / 32 / 3] [ 2 / 31 / 3] = [ 2 / 94 / 91 / 92 / 9]
maximum-entropy
etiqueta? ¿Estás buscando una solución de máxima entropía?