Teorema del límite central y la distribución de Pareto

¿Puede alguien proporcionar una explicación simple (laica) de la relación entre las distribuciones de Pareto y el Teorema del límite central (por ejemplo, ¿se aplica? ¿Por qué / por qué no?)? Estoy tratando de entender la siguiente declaración:

"El Teorema del límite central no funciona con todas las distribuciones. Esto se debe a un hecho disimulado: las medias de muestra se agrupan alrededor de la media de la distribución subyacente si existe. Pero, ¿cómo puede una distribución no tener media? Bueno, una distribución común eso no tiene ningún medio es la distribución de Pareto. Si trataras de calcularlo usando los métodos habituales, divergiría hasta el infinito ".

— usuario1222447
fuente

Respuestas:

$\alpha$

$\alpha>2$

Vea la descripción del teorema del límite central clásico aquí

La cita es un poco extraña, porque el teorema del límite central (en cualquiera de las formas mencionadas) no se aplica a la media de la muestra en sí, sino a una media estandarizada (y si intentamos aplicarla a algo cuya media y varianza son no finito, tendríamos que explicar con mucho cuidado de qué estamos hablando, ya que el numerador y el denominador implican cosas que no tienen límites finitos).

Sin embargo (a pesar de no expresarse del todo correctamente al hablar de teoremas del límite central) tiene algo de un punto subyacente: la media de la muestra no convergerá con la media de la población (la ley débil de los números grandes no se cumple, ya que la integral que define la media no es finita).

$n> 10^{10^{100}}$

$E(|X|^3)$

$\alpha\gt 3$ $n$

— Glen_b -Reinstate a Monica
fuente

α > 2

$\alpha > 2$

α > 3

$\alpha > 3$

@kjetil bastante así; en la práctica, necesita más que segundos segundos porque la convergencia puede ser inútilmente lenta.

— Glen_b: reinstala a Mónica el

¡Sí, agregaré una respuesta para mostrar eso!

— kjetil b halvorsen

Algunas distribuciones que no siguen el teorema del límite central pueden estandarizarse para converger a una ley estable.

— Michael R. Chernick

Gran discusión aquí. Wish stackexchange tenía una manera de seguir las respuestas / comentarios de las personas;)

— Chan-Ho Suh

$\alpha > 2$

$\alpha=2.1$ $\alpha=3.1$

###  Pareto dist and the central limit theorem
###
require(actuar) # for (dpqr)pareto1()
require(MASS) #  for Scott()
require(scales) # for alpha()
# We use (dpqr)pareto1(x,alpha,1)
#
alpha <- 2.1  #  variance just barely exist
E <-  function(alpha) ifelse(alpha <= 1,Inf,alpha/(alpha-1))
VAR <- function(alpha) ifelse(alpha <= 2,Inf,alpha/((alpha-1)^2 * (alpha-2)))

R <- 10000
e <-  E(alpha)
sigma  <-  sqrt(VAR(alpha))
sim <-  function(n) {
    replicate(R, {x <- rpareto1(n,alpha,1)
        x <- x-e
        mean(x)*sqrt(n)/sigma },simplify=TRUE)
}
sim1 <- sim(10)
sim2 <- sim(100)
sim3 <- sim(1000)
sim4 <- sim(10000) # do take some time ...

### These are standardized so have all theoretically variance 1.
### But due to the long tail, the empirical variances are (surprisingly!) much lower:

sd(sim1)
sd(sim2)
sd(sim3)
sd(sim4)

### Now we plot the histograms:
    hist(sim1,prob=TRUE,breaks="Scott",col=alpha("grey05",0.95),main="simulated pareto means",xlim=c(-1.8,16))
hist(sim2,prob=TRUE,breaks="Scott",col=alpha("grey30",0.5),add=TRUE)
hist(sim3,prob=TRUE,breaks="Scott",col=alpha("grey60",0.5),add=TRUE)
hist(sim4,prob=TRUE,breaks="Scott",col=alpha("grey90",0.5),add=TRUE)
plot(dnorm,from=-1.8,to=5,col=alpha("red",0.5),add=TRUE)

Y aquí está la trama:

$n=10000$ $\sigma^2=1$ . Una forma práctica de pensar en eso es la siguiente. Las distribuciones de Pareto a menudo se proponen para modelar las distribuciones de ingresos (o riqueza). La expectativa de ingresos (o riqueza) tendrá una contribución muy grande de los muy pocos multimillonarios. ¡El muestreo con tamaños de muestra prácticos tendrá una probabilidad muy pequeña de incluir a multimillonarios en la muestra!

— kjetil b halvorsen
fuente

Me gustan las respuestas ya dadas, pero creo que hay muchas técnicas para una "explicación laica", así que intentaré algo más intuitivo (comenzando por una ecuación ...).

$p$

μ = \int x \cdot p (x) d x

$\mu = \int x \cdot p(x) dx$

x

$x$

x

$x$

x

$x$

x

$x$

p (x)

$p(x)$

x \cdot p (x)

$x \cdot p(x)$

p (x)

$p(x)$

μ

$\mu$

p

$p$

$\bar{x}=\frac{1}{n} \sum_i x_i$ $\mu$ $p$ $n$ $n$ $\bar{x}$ $n$ $p$

N=10000;
x=rnorm(N,1,1);
y=rep(NA,N);
for(index in seq(1,N))
{
y[index]=mean(x[1:index])
}
png('~/Desktop/normalMean.png')
plot(y,type='l',xlab='n',ylab='sum(x_i)/n')
dev.off()

Esta es una realización típica, la media muestral converge con la media de densidad de manera bastante adecuada (y en promedio en la forma dada por el teorema del límite central). Hagamos lo mismo para una distribución pareto sin media (sustituyendo rnorm (N, 1,1); por pareto (N, 1.1,1);)

$p(x) \cdot x$ $x$ $x$

$n$ $\int (x-\mu)^2 p(x) dx$

— peuhp
fuente