Puede ser instructivo demostrar este resultado a partir de los primeros principios y resultados básicos , explotando las propiedades de las funciones generadoras acumulativas (exactamente como en las pruebas estándar del Teorema del límite central). Requiere que comprendamos la tasa de crecimiento de los números armónicos generalizados para Estas tasas de crecimiento son bien conocidas y fáciles de obtener en comparación con las integrales : convergen para y de lo contrario divergen logarítmicamente para .
H(n,s)=∑k=1nk−s
s=1,2,….∫n1x−sdxs>1s=1
Deje y . Por definición, la función de generación acumulativa (cgf) de esn≥21≤k≤n(Xk−1/k)/Bn
ψk,n(t)=logE(exp(Xk−1/kBnt))=−tkBn+log(1+−1+exp(t/Bn)k).
La expansión en serie del lado derecho, obtenida de la expansión de alrededor de , toma la formalog(1+z)z=0
ψk,n(t)=(k−1)2k2B2nt2+k2−3k+26k3B3nt3+⋯+kj−1−⋯±(j−1)!j!kjBjntj+⋯.
Los numeradores de las fracciones son polinomios en con el término principal . Debido a que la expansión del registro converge absolutamente para , esta expansión converge absolutamente cuandokkj−1∣∣−1+exp(t/Bn)k∣∣<1
|exp(t/Bn)−1|<k.
(En caso de que converja en todas partes). Para fijo y valores crecientes de , la divergencia (obvia) de implica que el dominio de convergencia absoluta crece arbitrariamente grande. Por lo tanto, para cualquier fijo y suficientemente grande , esta expansión converge absolutamente.k=1knBntn
Por lo tanto , para suficientemente grande , entonces podemos sumar el individuo sobre término por término en potencias de para obtener el cgf de ,nψk,nktSn/Bn
ψn(t)=∑k=1nψk,n(t)=12t2+⋯+1Bjn(∑k=1n(k−1−⋯±(j−1)!k−j))tjj+⋯.
Tomar los términos en las sumas sobre uno a la vez requiere que evaluemos expresiones proporcionales ak
b(s,j)=1Bjn∑k=1nk−s
para y . Utilizando las asíntotas de los números armónicos generalizados mencionados en la introducción, se deduce fácilmente dej≥3s=1,2,…,j
B2n=H(n,1)−H(n,2)∼log(n)
ese
b(1,j)∼(log(n))1−j/2→0
y (para )s>1
b(s,j)∼(log(n))−j/2→0
a medida que crece grande. Por consiguiente, todos los términos en la expansión de más allá de convergen a cero, de donde converge a para cualquier valor de . Dado que la convergencia de la cgf implica la convergencia de la función característica, del teorema de continuidad de Levy concluimos que acerca a una variable aleatoria cuya cgf es 2/2 : esa es la variable normal estándar, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2
Este análisis revela cuán delicada es la convergencia: mientras que en muchas versiones del Teorema del límite central el coeficiente de es (para ), aquí el coeficiente es solo : la convergencia es mucho más lenta. En este sentido, la secuencia de variables estandarizadas "apenas" se vuelve Normal.tjO(n1−j/2)j≥3O(((log(n))1−j/2)
Podemos ver esta lenta convergencia en una serie de simulaciones. Los histogramas muestran iteraciones independientes para cuatro valores de . Las curvas rojas son gráficos de funciones de densidad normal estándar para referencia visual. Aunque evidentemente hay una tendencia gradual hacia la normalidad, incluso en (donde todavía es considerable) sigue habiendo una no normalidad apreciable, como lo demuestra la asimetría (igual a en esta muestra). (No sorprende que la asimetría de este histograma esté cerca de , porque ese es precisamente el término en el cgf).105nn=1000(log(n))−1/2≈0.380.35(log(n))−1/2t3
Aquí está el R
código para aquellos que deseen experimentar más.
set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
z <- colSums(x - 1/(1:n)) / B.n
hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}