Supongo que puede evaluar y g hasta una constante de normalización. Denote f ( x ) = f u ( x ) / c f y g ( x ) = g u ( x ) / c gfgf(x)=fu(x)/cfsol( x ) = gtu( x ) / csol .
Un estimador consistente que puede usarse es
, donde
r = 1 / n
reKLˆ( fEl | El | sol) = [ n- 1∑jFtu( xj) / πF( xj) ]- 11norte∑yonorte[ log( ftu( zyo)soltu( zyo)) ftu( zyo)πr( zyo)] -iniciar sesión( r^)
es un estimador de muestreo importante para la relación
cf/cg. Aquí usa
πfy
πgcomo densidades instrumentales para
fuy
gurespectivamente, y
πrpara apuntar a la relación logarítmica de densidades no normalizadas.
r^= 1 / n1 / n∑jFtu( xj) / πF( xj)∑jsoltu( yj) / πsol( yj).(1)
CF/ csolπFπsolFtusoltuπr
Deje que , { y i } ∼ π g , y { z i } ∼ π r . El numerador de (1) converge a c f . El denominador converge a c g{ xyo} ∼ πF{ yyo} ∼ πsol{ zyo} ∼ πrcfcg . La relación es consistente por el teorema de mapeo continuo. El registro de la relación es consistente mediante el mapeo continuo nuevamente.
En cuanto a la otra parte del estimador,
por la ley de los grandes números.
1N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]→ascfE[log(fu(zi)gu(zi))]
Mi motivación es la siguiente:
Así que solo lo rompo en pedazos manejables.
DKL(f||g)=∫∞−∞f(x)log(f(x)g(x))dx=∫∞−∞f(x){log[fu(x)gu(x)]+log[cgcf]}dx=Ef[logfu(x)gu(x)]+log[cgcf]=c−1fEπr[logfu(x)gu(x)fu(x)πr(x)]+log[cgcf].
Para obtener más ideas sobre cómo simular la razón de probabilidad, encontré un artículo que tiene algunas:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732