Teorema del límite central y la distribución de Pareto


10

Respuestas:


15

α

α>2

Vea la descripción del teorema del límite central clásico aquí

La cita es un poco extraña, porque el teorema del límite central (en cualquiera de las formas mencionadas) no se aplica a la media de la muestra en sí, sino a una media estandarizada (y si intentamos aplicarla a algo cuya media y varianza son no finito, tendríamos que explicar con mucho cuidado de qué estamos hablando, ya que el numerador y el denominador implican cosas que no tienen límites finitos).

Sin embargo (a pesar de no expresarse del todo correctamente al hablar de teoremas del límite central) tiene algo de un punto subyacente: la media de la muestra no convergerá con la media de la población (la ley débil de los números grandes no se cumple, ya que la integral que define la media no es finita).


n>1010100

E(|X|3)

α>3n


2
α>2α>3

@kjetil bastante así; en la práctica, necesita más que segundos segundos porque la convergencia puede ser inútilmente lenta.
Glen_b: reinstala a Mónica el

1
¡Sí, agregaré una respuesta para mostrar eso!
kjetil b halvorsen

2
Algunas distribuciones que no siguen el teorema del límite central pueden estandarizarse para converger a una ley estable.
Michael R. Chernick

Gran discusión aquí. Wish stackexchange tenía una manera de seguir las respuestas / comentarios de las personas;)
Chan-Ho Suh

9

α>2

α=2.1α=3.1

###  Pareto dist and the central limit theorem
###
require(actuar) # for (dpqr)pareto1()
require(MASS) #  for Scott()
require(scales) # for alpha()
# We use (dpqr)pareto1(x,alpha,1)
#
alpha <- 2.1  #  variance just barely exist
E <-  function(alpha) ifelse(alpha <= 1,Inf,alpha/(alpha-1))
VAR <- function(alpha) ifelse(alpha <= 2,Inf,alpha/((alpha-1)^2 * (alpha-2)))

R <- 10000
e <-  E(alpha)
sigma  <-  sqrt(VAR(alpha))
sim <-  function(n) {
    replicate(R, {x <- rpareto1(n,alpha,1)
        x <- x-e
        mean(x)*sqrt(n)/sigma },simplify=TRUE)
}
sim1 <- sim(10)
sim2 <- sim(100)
sim3 <- sim(1000)
sim4 <- sim(10000) # do take some time ...

### These are standardized so have all theoretically variance 1.
### But due to the long tail, the empirical variances are (surprisingly!) much lower:

sd(sim1)
sd(sim2)
sd(sim3)
sd(sim4)

### Now we plot the histograms:
    hist(sim1,prob=TRUE,breaks="Scott",col=alpha("grey05",0.95),main="simulated pareto means",xlim=c(-1.8,16))
hist(sim2,prob=TRUE,breaks="Scott",col=alpha("grey30",0.5),add=TRUE)
hist(sim3,prob=TRUE,breaks="Scott",col=alpha("grey60",0.5),add=TRUE)
hist(sim4,prob=TRUE,breaks="Scott",col=alpha("grey90",0.5),add=TRUE)
plot(dnorm,from=-1.8,to=5,col=alpha("red",0.5),add=TRUE)

Y aquí está la trama:

Pareto simulado significa histograma

n=10000σ2=1. Una forma práctica de pensar en eso es la siguiente. Las distribuciones de Pareto a menudo se proponen para modelar las distribuciones de ingresos (o riqueza). La expectativa de ingresos (o riqueza) tendrá una contribución muy grande de los muy pocos multimillonarios. ¡El muestreo con tamaños de muestra prácticos tendrá una probabilidad muy pequeña de incluir a multimillonarios en la muestra!


3

Me gustan las respuestas ya dadas, pero creo que hay muchas técnicas para una "explicación laica", así que intentaré algo más intuitivo (comenzando por una ecuación ...).

p

μ=xp(x)dx
xxxxp(x)xp(x)p(x)μp

x¯=1nixiμpnnx¯np

N=10000;
x=rnorm(N,1,1);
y=rep(NA,N);
for(index in seq(1,N))
{
y[index]=mean(x[1:index])
}
png('~/Desktop/normalMean.png')
plot(y,type='l',xlab='n',ylab='sum(x_i)/n')
dev.off()

ingrese la descripción de la imagen aquí

Esta es una realización típica, la media muestral converge con la media de densidad de manera bastante adecuada (y en promedio en la forma dada por el teorema del límite central). Hagamos lo mismo para una distribución pareto sin media (sustituyendo rnorm (N, 1,1); por pareto (N, 1.1,1);)

ingrese la descripción de la imagen aquí

p(x)xxx

n(xμ)2p(x)dx

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.