La desviación estándar representa la dispersión debido a procesos aleatorios. Específicamente, muchas mediciones físicas que se espera que se deban a la suma de muchos procesos independientes tienen distribuciones normales (curva de campana).
La distribución de probabilidad normal viene dada por:
Y= 1σ2 π--√mi- ( x - μ )22 σ2
Dónde Y es la probabilidad de obtener un valor X dado un medio μ y σ…¡la desviación estándar!
En otras palabras, la desviación estándar es un término que surge de las variables aleatorias independientes que se suman. Por lo tanto, no estoy de acuerdo con algunas de las respuestas dadas aquí: la desviación estándar no es solo una alternativa a la desviación media que "resulta más conveniente para cálculos posteriores". La desviación estándar es la forma correcta de modelar la dispersión para fenómenos distribuidos normalmente.
Si observa la ecuación, puede ver que la desviación estándar pesa más las desviaciones mayores de la media. Intuitivamente, puede pensar en la desviación media como una medida de la desviación promedio real de la media, mientras que la desviación estándar representa una distribución en forma de campana, también conocida como "normal", alrededor de la media. Entonces, si sus datos se distribuyen normalmente, la desviación estándar le indica que si muestra más valores, ~ 68% de ellos se encontrarán dentro de una desviación estándar alrededor de la media.
Por otro lado, si tiene una variable aleatoria única, la distribución podría verse como un rectángulo, con la misma probabilidad de que aparezcan valores en cualquier lugar dentro de un rango. En este caso, la desviación media podría ser más apropiada.
TL; DR si tiene datos que se deben a muchos procesos aleatorios subyacentes o que simplemente sabe que se distribuyen normalmente, use la función de desviación estándar.