¿Puede alguien proporcionar una explicación simple (laica) de la relación entre las distribuciones de Pareto y el Teorema del límite central (por ejemplo, ¿se aplica? ¿Por qué / por qué no?)? Estoy tratando de entender la siguiente declaración:
¿Puede alguien proporcionar una explicación simple (laica) de la relación entre las distribuciones de Pareto y el Teorema del límite central (por ejemplo, ¿se aplica? ¿Por qué / por qué no?)? Estoy tratando de entender la siguiente declaración:
Respuestas:
Vea la descripción del teorema del límite central clásico aquí
La cita es un poco extraña, porque el teorema del límite central (en cualquiera de las formas mencionadas) no se aplica a la media de la muestra en sí, sino a una media estandarizada (y si intentamos aplicarla a algo cuya media y varianza son no finito, tendríamos que explicar con mucho cuidado de qué estamos hablando, ya que el numerador y el denominador implican cosas que no tienen límites finitos).
Sin embargo (a pesar de no expresarse del todo correctamente al hablar de teoremas del límite central) tiene algo de un punto subyacente: la media de la muestra no convergerá con la media de la población (la ley débil de los números grandes no se cumple, ya que la integral que define la media no es finita).
### Pareto dist and the central limit theorem
###
require(actuar) # for (dpqr)pareto1()
require(MASS) # for Scott()
require(scales) # for alpha()
# We use (dpqr)pareto1(x,alpha,1)
#
alpha <- 2.1 # variance just barely exist
E <- function(alpha) ifelse(alpha <= 1,Inf,alpha/(alpha-1))
VAR <- function(alpha) ifelse(alpha <= 2,Inf,alpha/((alpha-1)^2 * (alpha-2)))
R <- 10000
e <- E(alpha)
sigma <- sqrt(VAR(alpha))
sim <- function(n) {
replicate(R, {x <- rpareto1(n,alpha,1)
x <- x-e
mean(x)*sqrt(n)/sigma },simplify=TRUE)
}
sim1 <- sim(10)
sim2 <- sim(100)
sim3 <- sim(1000)
sim4 <- sim(10000) # do take some time ...
### These are standardized so have all theoretically variance 1.
### But due to the long tail, the empirical variances are (surprisingly!) much lower:
sd(sim1)
sd(sim2)
sd(sim3)
sd(sim4)
### Now we plot the histograms:
hist(sim1,prob=TRUE,breaks="Scott",col=alpha("grey05",0.95),main="simulated pareto means",xlim=c(-1.8,16))
hist(sim2,prob=TRUE,breaks="Scott",col=alpha("grey30",0.5),add=TRUE)
hist(sim3,prob=TRUE,breaks="Scott",col=alpha("grey60",0.5),add=TRUE)
hist(sim4,prob=TRUE,breaks="Scott",col=alpha("grey90",0.5),add=TRUE)
plot(dnorm,from=-1.8,to=5,col=alpha("red",0.5),add=TRUE)
Y aquí está la trama:
. Una forma práctica de pensar en eso es la siguiente. Las distribuciones de Pareto a menudo se proponen para modelar las distribuciones de ingresos (o riqueza). La expectativa de ingresos (o riqueza) tendrá una contribución muy grande de los muy pocos multimillonarios. ¡El muestreo con tamaños de muestra prácticos tendrá una probabilidad muy pequeña de incluir a multimillonarios en la muestra!
Me gustan las respuestas ya dadas, pero creo que hay muchas técnicas para una "explicación laica", así que intentaré algo más intuitivo (comenzando por una ecuación ...).
N=10000;
x=rnorm(N,1,1);
y=rep(NA,N);
for(index in seq(1,N))
{
y[index]=mean(x[1:index])
}
png('~/Desktop/normalMean.png')
plot(y,type='l',xlab='n',ylab='sum(x_i)/n')
dev.off()
Esta es una realización típica, la media muestral converge con la media de densidad de manera bastante adecuada (y en promedio en la forma dada por el teorema del límite central). Hagamos lo mismo para una distribución pareto sin media (sustituyendo rnorm (N, 1,1); por pareto (N, 1.1,1);)