Si define la varianza como s2norte=MSE= 1norte∑nortei = 1( xyo- x¯)2: similar a la varianza de la población pero con una media muestral paraμ, entonces ambas muestras tendrían la misma varianza.
Entonces, la diferencia se debe únicamente a la corrección de Bessel en la fórmula habitual para la varianza de la muestra ( s2n - 1= nn - 1⋅MSE=nn−1⋅1n∑ni=1(xi−x¯)2=1n−1∑ni=1(xi−x¯)2, que se ajusta por el hecho de que lamedia delamuestraestá más cerca de los datos que la media de la población, para que sea imparcial (tomando el valor correcto "en promedio").
El efecto desaparece gradualmente al aumentar el tamaño de la muestra, ya que n - 1norte va a 1 comon → ∞.
Por cierto, no hay una razón particular por la que tenga que usar el estimador imparcial para la varianza: s2norte es un estimador perfectamente válido y, en algunos casos, podría tener ventajas sobre la forma más común (la imparcialidad no es necesariamente tan grande) acuerdo).
La variación en sí misma no es directamente una medida de propagación. Si doblo todos los valores en mi conjunto de datos, afirmo que son el doble de "dispersos". Pero la varianza aumenta en un factor de 4. Por lo tanto, más comúnmente, se dice que la desviación estándar, en lugar de la varianza, es una medida de propagación.
Por supuesto, el mismo problema ocurre con la desviación estándar (la versión habitual sn - 1 ) que con la varianza: cuando duplica los puntos, la desviación estándar cambia, por la misma razón que sucede con la varianza.
En muestras pequeñas, la corrección de Bessel hace que la desviación estándar sea algo menos intuitiva como medida de propagación debido a ese efecto (que duplicar la muestra cambia el valor). Pero muchas medidas de propagación conservan el mismo valor al duplicar la muestra; Mencionaré algunos.
snorte (por supuesto)
la desviación media (absoluta) de la media
la desviación media (absoluta) de la mediana
el rango intercuartil (al menos para algunas definiciones de cuartiles de muestra)
{3, 5}
sí mismo es 1, según la primera fórmula. Como usted señala, el interlocutor ha intentado estimar la varianza de una población de la cual se presume que es una muestra, pero quién sabe si es o no.