No puedo encontrar una referencia, así que esbozaré la prueba aquí.
Teorema. Deje que sean variables aleatorias reales. Deje ser constantes. Supongamos que, para todo y todos en el soporte de , tenemosX1,⋯,Xna1,⋯,an,b1,⋯,bni∈{1,⋯,n}(x1,⋯,xi−1)(X1,⋯,Xi−1)
- E[Xi|X1=x1,⋯,Xi−1=xi−1]≤0 y
- P[Xi∈[ai,bi]]=1 .
Entonces, para todo ,t≥0
P[∑i=1nXi≥t]≤exp(−2t2∑ni=1(bi−ai)2).
Prueba. Defina . Afirmamos que Para todos y , tenemos
Por supuesto, y para todos en el soporte deYi=∑ij=1Xj
∀i∈{1,⋯,n} ∀λ≥0 E[eλYi]≤e18λ2∑ij=1(bj−aj)2.(*)
iλE[eλYi]=E[eλYi−1⋅eλXi]=E[eλYi−1⋅E[eλXi∣∣Yi−1]].
μ(yi−1):=E[Xi|Yi−1=yi−1]≤0P[Xi∈[ai,bi]]=1yi−1Yi−1. (Tenga en cuenta que .) Por lo tanto, según
el lema de Hoeffding , para todos en apoyo de y todos . Como , tenemos, para todos ,
Ahora la inducción produce el reclamo (*) anterior.
Yi−1=X1+⋯+Xi−1E[eλXi∣∣Yi−1=yi−1]≤eλμ(yi−1)+18λ2(bi−ai)2
yi−1Yi−1λ∈Rμ(yi−1)≤0λ≥0E[eλYi]≤E[eλYi−1⋅e0+18λ2(bi−ai)2].
Ahora aplicamos la desigualdad de Markov a y usamos nuestro reclamo (*). Para todas las ,
Finalmente, configure para minimizar la expresión de la mano derecha y obtener el resultado. eλYnt,λ>0
P[∑i=1nXi≥t]=P[Yn≥t]=P[eλYn≥eλt]≤E[eλYn]eλt≤e18λ2∑ni=1(bi−ai)2eλt.
λ=4t∑ni=1(bi−ai)2■
Como mencioné en mi comentario, la diferencia clave entre esto y la declaración "habitual" de la desigualdad de Azuma requiere , en lugar de . El primero permite una mayor flexibilidad y esto ahorra un factor de 2 en algunos casos.Xi∈[ai,bi]Xi∈[−a,a]
Tenga en cuenta que las variables aleatorias en la prueba son una supermartingala. Puede obtener la versión habitual de la desigualdad de Azuma tomando un Martingala , estableciendo y (donde ) y luego aplica el resultado anterior.YiY1,⋯,YnXi=Yi−Yi−1[ai,bi]=[−ci,ci]P[|Yi−Yi−1|≤ci]=1