¿Cómo hacer ANOVA en datos que aún no son normales después de las transformaciones?


8

Estoy mirando el efecto que tienen las condiciones inductoras de derrota y atrapamiento en las calificaciones subjetivas de derrota y atrapamiento en tres puntos de tiempo diferentes (entre otras cosas).

Sin embargo, las clasificaciones subjetivas no se distribuyen normalmente. He hecho varias transformaciones y la transformación de raíz cuadrada parece funcionar mejor. Sin embargo, todavía hay algunos aspectos de los datos que no se han normalizado. Esta no normalidad se manifiesta en una asimetría negativa en condiciones de alta derrota y alta atrapamiento en el momento en el que esperaba que hubiera las calificaciones más altas de derrota y atrapamiento. En consecuencia, creo que se podría argumentar que este sesgo se debe a la manipulación experimental.

¿Sería aceptable ejecutar ANOVA en estos datos a pesar de la falta de normalidad, dadas las manipulaciones? ¿O las pruebas no paramétricas serían más apropiadas? Si es así, ¿hay un equivalente no paramétrico de un ANOVA mixto 4x3?

Respuestas:


15

Son los residuos los que deberían distribuirse normalmente, no la distribución marginal de su variable de respuesta.

Intentaría usar transformaciones, realizar el ANOVA y verificar los residuos. Si se ven notablemente no normales, independientemente de la transformación que use, cambiaría a una prueba no paramétrica como la prueba de Friedman.


1
+1. Es de destacar que existen procedimientos formales bastante simples para investigar las transformaciones, como las gráficas de propagación vs. nivel (descritas en el EDA de Tukey ).
whuber

3

Creo que con datos sesgados negativamente, es posible que tenga que reflejar los datos para ser sesgado positivamente antes de aplicar otra transformación de datos (por ejemplo, log o raíz cuadrada). Sin embargo, esto tiende a dificultar la interpretación de sus resultados.

¿Cuál es su tamaño de muestra? Dependiendo de qué tan grande sea exactamente, las pruebas paramétricas pueden dar estimaciones bastante buenas.

De lo contrario, para una alternativa no paramétrica, tal vez pueda probar la prueba de Friedman .

Además, puede intentar realizar un MANOVA para medidas repetidas, con una variable de tiempo explícita incluida, como alternativa a un ANOVA mixto 4x3. Una diferencia importante es que el supuesto de esfericidad es relajado (o más bien, se estima para usted) y que todos los puntos temporales de su variable de resultado se ajustan de una vez.


FWIW, cualquier transformación de poder de Box-Cox mayor que 1 reducirá el sesgo negativo. Sin embargo, a la luz de la respuesta de Rob Hyndman, no es lo primero que hay que intentar.
whuber

2

Una transformación de boxcox (hay una en el paquete MASS) funciona tan bien en datos negativos como positivamente sesgados. Para su información, debe ingresar una fórmula en esa función como y ~ 1 y asegurarse de que todo y sea positivo primero (si no es solo agregar una constante como abs (min (y))). Puede que tenga que ajustar el rango lambda en la función para encontrar el pico de la curva. Le dará el mejor valor lambda para elegir y luego simplemente aplique esta transformación:

b <- boxcox(y~1)
lambda <- b$x[b$y == max(b$y)]
yt <- (y^lambda-1)/lambda
#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)

Vea si sus datos son normales entonces.

#you can transform back with
ytb <- (t*lambda+1)^(1/lambda)
#maybe put back the min
ytb <- ytb - abs(min(y))
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.