En lugar de entrar en matemáticas, trataré de ponerlo en palabras simples. Si tiene toda la población a su disposición, entonces su varianza ( varianza de población ) se calcula con el denominador N
. Del mismo modo, si solo tiene una muestra y desea calcular la varianza de esta muestra , utilice el denominador N
(n de la muestra, en este caso). En ambos casos, tenga en cuenta que no estima nada: la media que midió es la media real y la varianza que calculó a partir de esa media es la varianza verdadera.
Ahora, solo tiene una muestra y desea inferir sobre la media y la varianza desconocidas en la población. En otras palabras, quieres estimaciones . Usted toma la media de su muestra para la estimación de la media de la población (porque su muestra es representativa), OK. Para obtener una estimación de la varianza de la población, debe pretender que esa media es realmente la media de la población y, por lo tanto, ya no depende de su muestra desde que la calculó. Para "mostrar" que ahora lo toma como fijo, reserva una (cualquier) observación de su muestra para "apoyar" el valor de la media: sea lo que sea que haya sucedido su muestra, una observación reservada siempre podría llevar la media al valor que usted ' que tengo y que creo es insensible a las contingencias de muestreo. Una observación reservada es "-1"N-1
en cálculo de la varianza estimada.
Imagine que de alguna manera conoce la media real de la población, pero desea estimar la varianza de la muestra. Luego sustituirá esa media verdadera en la fórmula para la varianza y aplicará el denominador N
: aquí no se necesita "-1" ya que conoce la media verdadera, no la estimó a partir de esta misma muestra.