Estoy confundido acerca de la suposición de normalidad en medidas repetidas ANOVA. Específicamente, me pregunto qué tipo de normalidad debería satisfacerse exactamente. Al leer la literatura y las respuestas en CV, me encontré con tres palabras distintas de esta suposición.
La variable dependiente dentro de cada condición (repetida) debe distribuirse normalmente.
A menudo se dice que rANOVA tiene los mismos supuestos que ANOVA, más la esfericidad. Esa es la afirmación en las estadísticas de Field's Discovering , así como en el artículo de Wikipedia sobre el tema y el texto de Lowry .
Los residuos (diferencias entre todos los pares posibles?) Deben distribuirse normalmente.
Encontré esta afirmación en múltiples respuestas en CV ( 1 , 2 ). Por analogía de rANOVA con la prueba t emparejada , esto también puede parecer intuitivo.
La normalidad multivariada debe ser satisfecha.
Wikipedia y esta fuente mencionan esto. Además, sé que rANOVA puede intercambiarse con MANOVA, lo que podría merecer esta afirmación.
¿Son equivalentes de alguna manera? Sé que la normalidad multivariada significa que cualquier combinación lineal de los DV se distribuye normalmente, por lo que 3. naturalmente incluiría 2. si entiendo esto último correctamente.
Si no son lo mismo, ¿cuál es el supuesto "verdadero" de la rANOVA? ¿Me puede proporcionar una referencia?
Me parece que hay más apoyo para el primer reclamo. Sin embargo, esto no está en línea con las respuestas que generalmente se proporcionan aquí.
Modelos lineales mixtos
Debido a la sugerencia de @ utobi, ahora entiendo cómo se puede restablecer rANOVA como un modelo mixto lineal. Específicamente, para modelar cómo cambia la presión arterial con el tiempo, modelaría el valor esperado como: donde son las mediciones de la presión arterial, la presión media de la sangre de la sujeto-ésimo, y como el tiempo -ésimo la se midió sujeto -ésimo, denota que el cambioy i j a i i t i j j i b i
Finalmente, traté de pensar en lo que esto significa para la normalidad, pero con poco éxito. Parafraseando a McCulloch y Searle (2001, p. 35. Eq. (2.14)):
Entiendo que esto significa que
4. los datos de cada individuo deben distribuirse normalmente, pero esto no es razonable para probar con pocos puntos de tiempo.
Tomo la tercera expresión para decir que
5. los promedios de asignaturas individuales se distribuyen normalmente. Tenga en cuenta que estas son otras dos posibilidades distintas además de las tres mencionadas anteriormente.
McCulloch, CE y Searle, SR (2001). Modelos generalizados, lineales y mixtos . Nueva York: John Wiley & Sons, Inc.