Salida del supuesto de normalidad en ANOVA: ¿es la curtosis o asimetría más importante?

Modelos estadísticos lineales aplicados por Kutner et al. establece lo siguiente con respecto a las desviaciones del supuesto de normalidad de los modelos ANOVA: La curtosis de la distribución del error (más o menos pico que una distribución normal) es más importante que el sesgo de la distribución en términos de los efectos sobre las inferencias .

Estoy un poco desconcertado por esta declaración y no pude encontrar ninguna información relacionada, ya sea en el libro o en línea. Estoy confundido porque también aprendí que los gráficos QQ con colas pesadas son una indicación de que la suposición de normalidad es "lo suficientemente buena" para los modelos de regresión lineal, mientras que los gráficos QQ sesgados son más preocupantes (es decir, una transformación podría ser apropiada) .

¿Estoy en lo cierto al decir que ANOVA tiene el mismo razonamiento y que su elección de palabras ( más importante en términos de los efectos sobre las inferencias ) se eligió mal? Es decir, una distribución sesgada tiene consecuencias más graves y debe evitarse, mientras que una pequeña cantidad de curtosis puede ser aceptable.

EDITAR: Según lo dirigido por rolando2, es difícil decir que uno es más importante que el otro en todos los casos, pero simplemente estoy buscando una idea general. Mi problema principal es que me enseñaron que en la regresión lineal simple, los gráficos QQ con colas más pesadas (¿curtosis?) Están bien, ya que la prueba F es bastante robusta en contra de esto. Por otro lado, las parcelas QQ sesgadas (en forma de parábola) suelen ser una preocupación mayor. Esto parece ir directamente en contra de las pautas que mi libro de texto proporciona para ANOVA, a pesar de que los modelos ANOVA pueden convertirse en modelos de regresión y deben tener los mismos supuestos.

Estoy convencido de que estoy pasando por alto algo o tengo una suposición falsa, pero no puedo entender qué podría ser.

— Zenit
fuente

En su revisión de la curtosis, DeCarlo (1997) sugirió exactamente lo contrario, ese sesgo era más importante en ANOVA y otras pruebas de igualdad de medios. Puede encontrar útiles las citas en la página 297: columbia.edu/~ld208/psymeth97.pdf

— Anthony

La pregunta sería más productiva si pudiera resolverse en una declaración como "La asimetría es mucho más importante para las inferencias que la curtosis, que la asimetría a nivel de ___ distorsionaría los resultados tanto como la curtosis a nivel de ___ ". Sin alguna de estas cuantificaciones, simplemente decir que uno u otro es más importante no nos ayuda mucho.

— rolando2

Esta simulación emis.de/journals/HOA/ADS/Volume7_4/206.pdf por Khan y Rayner (2003) en REVISTA DE CIENCIAS APLICADAS DE MATEMÁTICAS Y DECISIONES afirma que "las pruebas de ANOVA y Kruskal-Wallis están mucho más afectadas por la curtosis de la distribución de errores en lugar de por su asimetría "(p. 204).

— bsbk

Una pregunta extremadamente estrecha relacionada con la prueba t de dos muestras, efectivamente un ANOVA unidireccional con dos niveles en el factor, es stats.stackexchange.com/questions/38967/… ... Actualmente existe una recompensa por agregar referencias ya que ninguna de las respuestas existentes contiene citas, por lo que los que responden a esta pregunta pueden querer echarle un vistazo.

— Silverfish

Estoy de acuerdo con @ rolando2: "la asimetría es peor que la curtosis" o viceversa, es una declaración bastante vacía sin mencionar el grado de asimetría / curtosis. ¡Pero también se debe considerar más! Por ejemplo, la robustez de este tipo de violaciones de la normalidad depende en parte de si los tamaños de los grupos son iguales , y la robustez de la asimetría puede depender de la dirección de la asimetría : es peor si un grupo está sesgado en un sentido, y el otro grupo sesgó de manera contraria, que si ambos grupos estuvieran sesgados en la misma dirección. (Esto es de memoria y re-pruebas, pero ese es un tipo de ANOVA.)

— Silverfish

Respuestas:

La dificultad es que la asimetría y la curtosis son dependientes; Sus efectos no se pueden separar por completo.

El problema es que si desea examinar el efecto de una distribución muy sesgada, también debe tener una distribución con curtosis alta.

$\geq$ $^2+1$

* (curtosis ordinaria del cuarto momento escalada, no curtosis excesiva)

Khan y Rayner (que se menciona en la respuesta anterior) trabajan con una familia que permite explorar el impacto de la asimetría y la curtosis, pero no pueden evitar este problema, por lo que su intento de separarlos limita severamente la medida en que el efecto de la asimetría puede ser explorada.

$\beta_2$ $\sqrt{\beta_2-1}$

Por ejemplo, si desea ver el efecto de una alta asimetría, digamos asimetría> 5, ¡ no puede obtener una distribución con curtosis inferior a 26!

Entonces, si desea investigar el impacto de la alta asimetría, no puede evitar investigar el impacto de la curtosis alta. En consecuencia, si intentas separarlos, en realidad no puedes evaluar el efecto de aumentar la asimetría a niveles altos.

Dicho esto, al menos para la familia de distribución que consideraron, y dentro de los límites que plantea la relación entre ellos, la investigación de Khan y Rayner parece sugerir que la curtosis es el principal problema.

$>\sqrt{2}$

— Glen_b -Reinstate a Monica
fuente

Este problema se aborda en "Robustez a la no normalidad de las pruebas comunes para el problema de ubicación de muchas muestras" por Khan y Rayner.

Descubrieron que las pruebas de ANOVA están mucho más afectadas por la curtosis que la asimetría, y el efecto de la asimetría no está relacionado con su dirección.

Si se sospechan desviaciones de la normalidad, la prueba de Kruskal-Wallis podría ser una mejor opción. La prueba de Kruskal-Wallis es más robusta a las desviaciones de la normalidad porque examina la hipótesis de que las medianas de tratamiento son idénticas. ANOVA examina la hipótesis de que los medios de tratamiento son idénticos.

— Brian Spiering
fuente

¿Esto también indica que debería interpretar los gráficos QQ de manera diferente para la regresión lineal y ANOVA? La mayoría de las transformaciones que he hecho redujo la asimetría, pero dejó colas ligeramente pesadas (¿curtosis?). Tenía la impresión de que la prueba F era lo suficientemente robusta como para lidiar con lo último pero no con lo primero. ¿O es esto "colas pesadas están bien" un malentendido de mi parte? No puedo imaginar que exista una diferencia tan fundamental entre los dos, ya que los modelos ANOVA también pueden reescribirse como modelos de regresión lineal.

— Zenit