Tengo algunos datos que parecen trazar una gráfica de residuos frente al tiempo casi normal, pero quiero estar seguro. ¿Cómo puedo comprobar la normalidad de los residuos de error?
Tengo algunos datos que parecen trazar una gráfica de residuos frente al tiempo casi normal, pero quiero estar seguro. ¿Cómo puedo comprobar la normalidad de los residuos de error?
Respuestas:
Ninguna prueba le dirá que sus residuos se distribuyen normalmente. De hecho, usted puede apostar de forma fiable que son no .
Las pruebas de hipótesis generalmente no son una buena idea para verificar sus suposiciones. El efecto de la no normalidad en su inferencia generalmente no es una función del tamaño de la muestra *, pero el resultado de una prueba de significación sí lo es . Una pequeña desviación de la normalidad será obvia en un gran tamaño de muestra a pesar de que la respuesta a la pregunta de interés real ('¿en qué medida esto impactó mi inferencia?') Puede ser 'difícilmente'. En consecuencia, una gran desviación de la normalidad en un tamaño de muestra pequeño puede no tener importancia.
* (agregado en edición) - en realidad esa es una declaración demasiado débil. El impacto de la no normalidad en realidad disminuye con el tamaño de la muestra casi siempre que el CLT y el teorema de Slutsky se mantengan, mientras que la capacidad de rechazar la normalidad (y presumiblemente evitar los procedimientos de teoría normal) aumenta con el tamaño de la muestra ... así que cuando es más capaz de identificar la no normalidad que suele ser cuando no importa † de todos modos ... y la prueba no ayuda cuando realmente importa, en muestras pequeñas.
bueno, al menos en lo que respecta al nivel de significancia. Sin embargo, el poder aún puede ser un problema si consideramos muestras grandes como aquí, eso también puede ser un problema menor.
Lo que se acerca al tamaño del efecto de medición es un diagnóstico (ya sea una pantalla o una estadística) que mide el grado de no normalidad de alguna manera. Una gráfica QQ es una presentación obvia, y una gráfica QQ de la misma población con un tamaño de muestra y con un tamaño de muestra diferente son al menos ambas estimaciones ruidosas de la misma curva , mostrando aproximadamente la misma 'no normalidad'; al menos debería estar relacionado monotónicamente con la respuesta deseada a la pregunta de interés.
Si debe usar una prueba, Shapiro-Wilk es probablemente tan bueno como cualquier otra cosa (la prueba de Chen-Shapiro suele ser un poco mejor en alternativas de interés común, pero es más difícil encontrar implementaciones), pero está respondiendo una pregunta Ya sé la respuesta a; cada vez que no lo rechazas, te da una respuesta que puedes estar seguro de que está mal.
La prueba de Shapiro-Wilk es una posibilidad.
Esta prueba se implementa en casi todos los paquetes de software estadístico. La hipótesis nula es que los residuos se distribuyen normalmente, por lo tanto, un valor p pequeño indica que debe rechazar el valor nulo y concluir que los residuos no se distribuyen normalmente.
Tenga en cuenta que si el tamaño de su muestra es grande, casi siempre lo rechazará, por lo que la visualización de los residuos es más importante.
De wikipedia:
Las pruebas de normalidad univariante incluyen la prueba de K-cuadrado de D'Agostino, la prueba de Jarque-Bera, la prueba de Anderson-Darling, el criterio de Cramér-von Mises, la prueba de Lilliefors para la normalidad (una adaptación de la prueba de Kolmogorov-Smirnov), la prueba Prueba de Shapiro-Wilk, prueba de chi-cuadrado de Pearson y prueba de Shapiro-Francia. Un artículo de 2011 de The Journal of Statistical Modeling and Analytics [1] concluye que Shapiro-Wilk tiene el mejor poder para un significado dado, seguido de cerca por Anderson-Darling al comparar Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors y Anderson- Darling pruebas.