¿Cuáles son las pruebas estadísticas estándar para ver si los datos siguen distribuciones exponenciales o normales?
¿Cuáles son las pruebas estadísticas estándar para ver si los datos siguen distribuciones exponenciales o normales?
Respuestas:
Parece que está tratando de decidir si modelar sus datos utilizando la distribución normal o exponencial. Esto me parece algo extraño, ya que estas distribuciones son muy diferentes entre sí.
La distribución normal es simétrica, mientras que la distribución exponencial está muy sesgada a la derecha, sin valores negativos. Por lo general, una muestra de la distribución exponencial contendrá muchas observaciones relativamente cercanas a y algunas observaciones que se desvían a la derecha de . Esta diferencia es a menudo fácil de ver gráficamente.
Aquí hay un ejemplo en el que he simulado observaciones de una distribución normal con media y varianza y una distribución exponencial con media y varianza :
La simetría de la distribución normal y la asimetría de la exponencial se pueden ver usando histogramas, diagramas de caja y diagramas de dispersión, como se ilustra en la figura anterior.
Otra herramienta muy útil es un diagrama QQ . En el siguiente ejemplo, los puntos deberían seguir aproximadamente la línea si la muestra proviene de una distribución normal. Como puede ver, este es el caso de los datos normales, pero no de los datos exponenciales.
Si el examen gráfico por alguna razón no es suficiente para usted, aún puede usar una prueba para determinar si su distribución es normal o exponencial. Dado que la distribución normal es una familia de escala y ubicación, querrá usar una prueba que sea invariable bajo los cambios de escala y ubicación (es decir, el resultado de la prueba no debería cambiar si cambia sus medidas de pulgadas a centímetros o agrega a todas sus observaciones).
Cuando la hipótesis nula es que la distribución es normal y la hipótesis alternativa es que es exponencial, la más poderosa ubicación e invariante escala de la prueba está dada por la estadística donde es la media de la muestra, es la observación más pequeña en la muestra y es la desviación estándar de la muestra. La normalidad se rechaza a favor de la exponencialidad si es demasiado grande.
Esta prueba es en realidad una versión unilateral de la prueba de Grubbs para valores atípicos . Encontrará esto implementado en la mayoría del software estadístico (pero asegúrese de usar la versión correcta; ¡hay varias estadísticas de prueba alternativas que se usan para la prueba atípica!).
La referencia para es la prueba más poderosa: Sección 4.2.4 de Prueba de normalidad por HC Thode.
Para la distribución exponencial, puede usar una prueba llamada prueba de Moran o de Bartlett. El estadístico de prueba involucra la media muestral así como la media muestral del Bajo la hipótesis nula tenemos aproximadamente y una prueba de dos lados funciona. Esta prueba está diseñada contra alternativas gamma. B n ∼ χ 2 ( n - 1 )
Ver KC Kapur y LR Lamberson Confiabilidad en diseño de ingeniería . Wiley 1977.
Por normalidad, Anderson-Darling y Shapiro-Wilk son considerados los mejores. Para la prueba exponencial Lillerfors está diseñada específicamente para ello.
¿Ha considerado métodos gráficos para ver cómo se comportan los datos?
Las técnicas de gráficos de probabilidad generalmente implican clasificar los datos, aplicar el CDF inverso y luego trazar los resultados en el plano cartesiano. Esto le permite ver si varios valores se desvían de la distribución hipotética y posiblemente explican la razón de la desviación.