No estoy seguro de que esto sea un asunto puramente estadounidense contra británico. El resto de esta página está extraído de un faq que escribí. ( Http://www.graphpad.com/faq/viewfaq.cfm?faq=1383 ).
Cómo calcular la SD con n-1 en el denominador
Calcule el cuadrado de la diferencia entre cada valor y la media muestral.
Suma esos valores.
Divide la suma por n-1. El resultado se llama varianza.
Toma la raíz cuadrada para obtener la desviación estándar.
¿Por qué n-1?
¿Por qué dividir por n-1 en lugar de n cuando se calcula una desviación estándar? En el paso 1, calcula la diferencia entre cada valor y la media de esos valores. No sabes la verdadera media de la población; todo lo que sabes es la media de tu muestra. Excepto en los casos excepcionales en los que la media de la muestra es igual a la media de la población, los datos estarán más cerca de la media de la muestra que de la media de la población real. Entonces, el valor que calcula en el paso 2 probablemente será un poco más pequeño (y no puede ser más grande) de lo que sería si usara la media real de la población en el paso 1. Para compensar esto, divida entre n-1 que nv Esto se llama corrección de Bessel.
¿Pero por qué n-1? Si conociera la media de la muestra y todos los valores menos uno, podría calcular cuál debe ser ese último valor. Los estadísticos dicen que hay n-1 grados de libertad.
¿Cuándo debe calcularse la SD con un denominador de n en lugar de n-1?
Los libros de estadísticas a menudo muestran dos ecuaciones para calcular la SD, una con n, y la otra con n-1, en el denominador. Algunas calculadoras tienen dos botones.
La ecuación n-1 se usa en la situación común en la que está analizando una muestra de datos y desea sacar conclusiones más generales. La SD calculada de esta manera (con n-1 en el denominador) es su mejor estimación del valor de la SD en la población general.
Si simplemente desea cuantificar la variación en un conjunto particular de datos, y no planea extrapolar para sacar conclusiones más amplias, puede calcular la SD usando n en el denominador. La SD resultante es la SD de esos valores particulares. No tiene sentido calcular el SD de esta manera si desea estimar el SD de la población de la que se extrajeron esos puntos. Solo tiene sentido usar n en el denominador cuando no hay muestreo de una población, no hay deseo de sacar conclusiones generales.
El objetivo de la ciencia es casi siempre generalizar, por lo que no debe usarse la ecuación con n en el denominador. El único ejemplo que puedo pensar sobre dónde podría tener sentido es cuantificar la variación entre los puntajes de los exámenes. Pero mucho mejor sería mostrar un diagrama de dispersión de cada puntaje, o un histograma de distribución de frecuencia.