Siguiendo los comentarios en mi otra respuesta (¡y mirando nuevamente el título de la pregunta del OP!), Aquí hay una exploración teórica no muy rigurosa del tema.
Queremos determinar si Bias pueden tener diferente velocidad de convergencia que la raíz cuadrada de la varianza,B(θ^n)=E(θ^n)−θ
B(θ^n)=O(1/nδ),Var(θ^n)−−−−−−−√=O(1/nγ),γ≠δ???
Tenemos
B(θ^n)=O(1/nδ)⟹limnδE(θ^n)<K⟹limn2δ[E(θ^n)]2<K′
⟹[E(θ^n)]2=O(1/n2δ)(1)
mientras
Var(θ^n)−−−−−−−√=O(1/nγ)⟹limnγE(θ^2n)−[E(θ^n)]2−−−−−−−−−−−−−√<M
⟹limn2γE(θ^2n)−n2γ[E(θ^n)]2−−−−−−−−−−−−−−−−−−√<M
⟹limn2γE(θ^2n)−limn2γ[E(θ^n)]2<M′(2)
Vemos que puede ocurrir si sucede (2)
A) ambos componentes son , en cuyo caso solo podemos tener . γ = δO(1/n2γ)γ=δ
B) Pero también puede sostenerse si
limn2γ[E(θ^n)]2→0⟹[E(θ^n)]2=o(1/n2γ)(3)
Para que sea compatible con , debemos tener( 1 )(3)(1)
n2γ<n2δ⟹δ>γ(4)
Por lo tanto, parece que, en principio, es posible hacer que el sesgo converja a un ritmo más rápido que la raíz cuadrada de la varianza. Pero no podemos hacer que la raíz cuadrada de la varianza converja a un ritmo más rápido que el sesgo.