Me pregunto si la desviación estándar siempre se basó en el supuesto de una distribución normal. En otras palabras, si la muestra no se distribuye normalmente, ¿debería considerarse un error utilizar la desviación estándar?
Me pregunto si la desviación estándar siempre se basó en el supuesto de una distribución normal. En otras palabras, si la muestra no se distribuye normalmente, ¿debería considerarse un error utilizar la desviación estándar?
Respuestas:
No. El uso de la desviación estándar no supone normalidad.
La varianza de una variable aleatoria se define como . Mientras exista la varianza, la desviación estándar también existe. La desviación estándar es la raíz cuadrada de la varianza.
Puede usar la varianza o la desviación estándar en cualquier momento que existan. La variación surge en innumerables situaciones.
Hay teoremas especiales, lemas, etc., aunque para el caso especial donde sigue la distribución normal.
Si sigue la distribución normal, entonces hay aproximadamente un 95% de probabilidad de que se encuentre dentro de dos desviaciones estándar de la media.
Esa afirmación es cierta si sigue la distribución normal (y varias otras) pero no es cierta en general.
Sea una variable aleatoria con media y varianza . Definir para como variables aleatorias independientes, cada uno después de la distribución idéntica como .
Defina la media muestral basada en observaciones como:
Según el Teorema del límite central, converge hacia una variable aleatoria normalmente distribuida con media y varianza . (Más precisamente, converge en distribución a como ).
La implicación práctica es que la media de la muestra para grandes puede ser tratada como variable aleatoria distribuida normalmente cuya varianza es una función de la varianza de . (Recordar ) Y este resultado no requiere que sea normal. (Sin embargo, requiere una más baja para funcionar bien si está más cerca en cierto sentido de la distribución normal).
El Teorema del límite central es una herramienta omnipresente que utiliza la varianza de y no necesita que siga la distribución normal.