En lugar de confiar en una prueba de normalidad de los residuos, intente evaluar la normalidad con un juicio racional. Las pruebas de normalidad no le dicen que sus datos son normales, solo que no lo son. Pero dado que los datos son una muestra, puede estar seguro de que no son realmente normales sin una prueba. El requisito es aproximadamente normal. La prueba no puede decirte eso. Las pruebas también se vuelven muy sensibles en grandes N o más seriamente, varían en sensibilidad con N. Su N está en ese rango donde la sensibilidad comienza a aumentar. Si ejecuta la siguiente simulación en R varias veces y observa las gráficas, verá que la prueba de normalidad dice "no normal" en una buena cantidad de distribuciones normales.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Con suerte, después de pasar por las simulaciones, puede ver que una prueba de normalidad puede rechazar fácilmente datos de aspecto bastante normal y que los datos de una distribución normal pueden verse bastante lejos de lo normal. Si quieres ver un valor extremo de ese intento n <- 1000
. Todas las distribuciones se verán normales, pero aún fallarán la prueba aproximadamente a la misma velocidad que los valores de N más bajos. Y a la inversa, con una baja distribución de N que pasa la prueba puede parecer muy diferente de lo normal.
El gráfico residual estándar en SPSS no es terriblemente útil para evaluar la normalidad. Puede ver valores atípicos, el rango, la bondad de ajuste y quizás incluso el apalancamiento. Pero la normalidad es difícil de derivar de ella. Pruebe la siguiente simulación comparando histogramas, gráficos normales cuantil-cuantil y gráficos residuales.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
Es extraordinariamente difícil distinguir la normalidad, o mucho de cualquier cosa, del último argumento y, por lo tanto, no es un diagnóstico terrible de la normalidad.
En resumen, generalmente se recomienda no confiar en las pruebas de normalidad, sino en las gráficas de diagnóstico de los residuos. Sin esos gráficos o los valores reales en su pregunta, es muy difícil para cualquiera darle consejos sólidos sobre lo que necesitan sus datos en términos de análisis o transformación. Para obtener la mejor ayuda, proporcione los datos sin procesar.