Tener mucha práctica enseñando a los legos sobre la desviación estándar y la varianza.
TL; DR; Es algo así como el promedio de distancias del promedio. (lo cual es un poco confuso y engañoso en una versión tan concisa. Así que lea el artículo completo)
Supongo que el lego sabe sobre el promedio. Doy una charla sobre la importancia de conocer SD y estimar errores (ver PS a continuación). Luego prometo que no se utilizarán conocimientos matemáticos o estadísticos sagrados, solo un razonamiento seco y una lógica pura.
El problema. Digamos que tenemos un termómetro (elijo un dispositivo de medición dependiendo de lo que esté más cerca de lo auditivo).
Hicimos N mediciones de la misma temperatura y el termómetro nos mostró algo así como 36.5, 35.9, 37.0, 36.6, ... (vea la foto). Sabemos que la temperatura real fue la misma, pero el termómetro nos miente un poco en cada medición.
¿Cómo podemos estimar cuánto nos miente esta pequeña escoria?
Podemos calcular el promedio (ver línea roja en la imagen a continuación). ¿Podemos creerlo? Incluso después del promedio, ¿tiene suficiente precisión para nuestras necesidades?
El enfoque más fácil . Podemos tomar el punto más alejado, calcular la distancia entre él y el promedio (línea roja) y decir que así es como nos miente el termómetro, porque es el error máximo que vemos. Se podría adivinar, no es la mejor estimación. Si miramos la imagen, la mayoría de los puntos están alrededor del promedio, ¿cómo podemos decidir solo por un punto? En realidad, uno puede practicar las razones de numeración por las que dicha estimación es aproximada y generalmente mala.
Varianza . Entonces ... ¡tomemos todas las distancias y calculemos la distancia promedio !
Por cierto, ¿cómo calcular una distancia? Cuando escuchas la "distancia" en inglés (¿español? ¿Danés?) Se traduce como "restar" en matemáticas. Así, comenzamos nuestra fórmula con donde es el promedio y es una de las medidas.(xi−x¯)x¯xi
Entonces uno podría imaginar que la fórmula de la distancia promedio estaría sumando todo y dividiendo entre N:
∑(xi−x¯)N
Pero hay un problema. Podemos ver fácilmente, por ejemplo. que 36.4 y 36.8 están a la misma distancia de 36.6. pero si ponemos los valores en la fórmula anterior, obtenemos -0.2 y +0.2, y su suma es igual a 0, que no es lo que queremos.
¿Cómo deshacerse de la señal? (En este punto, los legos suelen decir "Tomar el valor absoluto", y obtener la sugerencia de que "tomar un valor absoluto es un poco artificial, ¿de qué otra manera?"). ¡Podemos cuadrar los valores! Entonces la fórmula se convierte en:
∑(xi−x¯)2N
.
Esta fórmula se llama "variación" en las estadísticas. Y es mucho mejor estimar la extensión de nuestros valores de termómetro (o lo que sea), que tomar solo la distancia máxima.
Desviación estándar . Pero aún hay un problema más. Mira la fórmula de la varianza. Los cuadrados hacen que nuestras unidades de medida ... sean cuadradas. Si el termómetro mide la temperatura en ° C (o ° F), nuestra estimación de error se mide en (o ). ¿Cómo neutralizar los cuadrados? - ¡Usa la raíz cuadrada!°C2°F2
∑(xi−x¯)2N−−−−−−−−−−√
Así que aquí llegamos a la fórmula de Desviación Estándar que comúnmente se denota como . Y esa es la mejor manera de estimar la precisión de nuestro dispositivo.σ
En este punto, un laico comprende muy claramente cómo llegamos aquí y cómo funciona la desviación / varianza estándar. Desde este punto, generalmente paso a la regla 68-95-99.7, que describe también sobre el muestreo y la población, el error estándar frente a los términos de desviación estándar, etc.
PD Importancia de saber SD talk ejemplo:
Digamos que tiene algún dispositivo de medición, que costó $ 1 000 000 . Y te da la respuesta: 42. ¿Crees que uno pagó 1 000 000 $ por 42? Phooey! Uno pagó 1000 000 por la precisión de esa respuesta. Porque el valor no cuesta nada sin conocer su error. Pagas por el error, no el valor. Aquí hay un buen ejemplo de vida.
En la vida común, la mayoría de las veces usamos una regla para medir una distancia. La regla te da precisión alrededor de un milímetro (si no estás en los EE. UU.). ¿Qué pasa si tiene que ir más allá del milímetro y medir algo con una precisión de 0.1 mm? - Probablemente usarías una pinza. Ahora, es fácil comprobar que una regla más barata (pero aún con precisión milimétrica) cuesta centavos, mientras que un buen calibrador cuesta la décima parte de los dólares. 2 magnitudes de un precio por 1 magnitud de la precisión. Y eso es muy habitual de cuánto paga por un error.