Suponga la siguiente situación:
tenemos un gran número (por ejemplo, 20) con grupos pequeños (por ejemplo, n = 3). Noté que si genero valores a partir de la distribución uniforme, los residuos se verán aproximadamente normales a pesar de que la distribución del error es uniforme. El siguiente código R demuestra este comportamiento:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
Si miro el residuo de una muestra en un grupo de tres, la razón del comportamiento es clara:
Dado que es una suma de variables aleatorias con una desviación estándar no muy diferente, su distribución está bastante más cerca de la distribución normal que los términos individuales.
Ahora suponga que tengo la misma situación con datos reales en lugar de datos simulados. Quiero evaluar si se cumplen los supuestos de ANOVA con respecto a la normalidad. La mayoría de los procedimientos recomendados recomiendan la inspección visual de los residuos (por ejemplo, QQ-Plot) o una prueba de normalidad en los residuos. Como mi ejemplo anterior, esto no es realmente óptimo para grupos pequeños.
¿Existe una mejor alternativa cuando tengo muchos grupos de tamaños pequeños?