La página de Wikipedia en ANOVA enumera tres supuestos , a saber:
- Independencia de casos: esta es una suposición del modelo que simplifica el análisis estadístico.
- Normalidad: las distribuciones de los residuos son normales.
- Igualdad (u "homogeneidad") de variaciones, llamada homocedasticidad ...
El punto de interés aquí es la segunda suposición. Varias fuentes enumeran el supuesto de manera diferente. Algunos dicen que la normalidad de los datos en bruto, algunos reclaman residuales.
Surgen varias preguntas:
- ¿son la normalidad y la distribución normal de los residuos la misma persona (según la entrada de Wikipedia, yo diría que la normalidad es una propiedad y no pertenece directamente a los residuos (pero puede ser una propiedad de los residuos (texto profundamente anidado entre paréntesis, extraño))?
- si no, ¿qué suposición debería ser válida? ¿Uno? ¿Ambos?
- Si la suposición de residuos distribuidos normalmente es la correcta, ¿estamos cometiendo un grave error al verificar la normalidad solo en el histograma de valores brutos?