La distribución de sus datos no necesita ser normal, es la distribución de muestreo que tiene que ser casi normal. Si el tamaño de su muestra es lo suficientemente grande, entonces la distribución de muestreo de las medias de Landau Distribution debería ser casi normal, debido al Teorema del límite central .
Por lo tanto, significa que debería poder usar t-test de forma segura con sus datos.
Ejemplo
Consideremos este ejemplo: supongamos que tenemos una población con distribución Lognormal con mu = 0 y sd = 0.5 (se parece un poco a Landau)
Entonces, tomamos muestras de 30 observaciones 5000 veces de esta distribución cada vez calculando la media de la muestra
Y esto es lo que obtenemos
Parece bastante normal, ¿no? Si aumentamos el tamaño de la muestra, es aún más evidente
Código R
x = seq(0, 4, 0.05)
y = dlnorm(x, mean=0, sd=0.5)
plot(x, y, type='l', bty='n')
n = 30
m = 1000
set.seed(0)
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 30')
x = seq(0.5, 1.5, 0.01)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))
n = 300
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 300')
x = seq(1, 1.25, 0.005)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))