Mi intuición es que la desviación estándar es: una medida de propagación de los datos.
Tiene un buen punto de que si es ancho o ajustado depende de cuál sea nuestro supuesto subyacente para la distribución de los datos.
Advertencia: Una medida de propagación es más útil cuando la distribución de sus datos es simétrica alrededor de la media y tiene una variación relativamente cercana a la de la distribución Normal. (Esto significa que es aproximadamente Normal).
En el caso de que los datos sean aproximadamente normales, la desviación estándar tiene una interpretación canónica:
- Región: media muestral +/- 1 desviación estándar, contiene aproximadamente el 68% de los datos
- Región: muestra media +/- 2 desviación estándar, contiene aproximadamente el 95% de los datos
- Región: media muestral +/- 3 desviación estándar, contiene aproximadamente el 99% de los datos
(ver primer gráfico en Wiki )
Esto significa que si sabemos que la media de la población es 5 y la desviación estándar es 2.83 y suponemos que la distribución es aproximadamente Normal, le diría que estoy razonablemente seguro de que si hacemos (una gran) muchas observaciones, solo el 5% lo hará ser menor que 0.4 = 5 - 2 * 2.3 o mayor que 9.6 = 5 + 2 * 2.3.
Observe cuál es el impacto de la desviación estándar en nuestro intervalo de confianza. (cuanto más extendido, más incertidumbre)
Además, en el caso general en el que los datos ni siquiera son aproximadamente normales, sino simétricos, usted sabe que existen algunos α para los cuales:
- Región: media muestral +/- α desviación estándar, contiene aproximadamente el 95% de los datos
Puede aprender el de una submuestra o asumir que α = 2αα = 2 y esto a menudo le da una buena regla general para calcular en su cabeza qué observaciones futuras esperar o cuáles de las nuevas observaciones pueden considerarse como valores atípicos. (¡tenga en cuenta la advertencia!)
No veo cómo se supone que debes interpretarlo. ¿2,83 significa que los valores están muy extendidos o están todos agrupados estrechamente alrededor de la media ...
Supongo que cada pregunta que se haga "amplia o estrecha" también debe contener: "¿en relación con qué?". Una sugerencia podría ser utilizar una distribución conocida como referencia. Dependiendo del contexto, podría ser útil pensar: "¿Es mucho más amplio o más ajustado que un Normal / Poisson?".
EDITAR: Basado en una pista útil en los comentarios, un aspecto más sobre la desviación estándar como medida de distancia.
Otra intuición más de la utilidad de la desviación estándar es que es una medida de distancia entre los datos de la muestra x 1 , ... , x N y su media ˉ x :snorteX1, ... , xnorteX¯
snorte= 1norte∑nortei = 1( xyo- x¯¯¯)2-------------√
A modo de comparación, el error cuadrático medio (MSE), una de las medidas de error más populares en estadística, se define como:
MSE=1n∑ni=1(Yi^−Yi)2
Se pueden plantear las preguntas ¿por qué funciona la distancia anterior? ¿Por qué distancias cuadradas, y no distancias absolutas, por ejemplo? ¿Y por qué estamos tomando la raíz cuadrada?
Tener funciones de distancia cuadrática, o error, tiene la ventaja de que podemos diferenciarlas y minimizarlas fácilmente. En lo que respecta a la raíz cuadrada, se suma a la interpretabilidad, ya que convierte el error nuevamente en la escala de nuestros datos observados.