La variabilidad que se reduce cuando N aumenta es la variabilidad de la media muestral, a menudo expresada como error estándar. O, en otros términos, la certeza de la veracidad de la media muestral está aumentando.
Imagina que ejecutas un experimento donde recolectas 3 hombres y 3 mujeres y mides sus alturas. ¿Qué tan seguro está de que las alturas medias de cada grupo son la verdadera media de las poblaciones separadas de hombres y mujeres? Debería pensar que no estarías muy seguro en absoluto. Podría recolectar fácilmente nuevas muestras de 3 y encontrar nuevas medias a varias pulgadas de las primeras. Muchos de los experimentos repetidos como este podrían incluso resultar en que las mujeres sean declaradas más altas que los hombres porque los medios variarían mucho. Con un N bajo, no tiene mucha certeza en la media de la muestra y varía mucho de una muestra a otra.
Ahora imagine 10,000 observaciones en cada grupo. Va a ser bastante difícil encontrar nuevas muestras de 10,000 que tengan medios que difieran mucho entre sí. Serán mucho menos variables y estarás más seguro de su precisión.
Si puede aceptar esta línea de pensamiento, entonces podemos insertarla en los cálculos de sus estadísticas como error estándar. Como puede ver en su ecuación, es una estimación de un parámetro, (que debería ser más preciso a medida que n aumenta) dividido por un valor que siempre aumenta con n, . Ese error estándar representa la variabilidad de las medias o efectos en sus cálculos. Cuanto más pequeño es, más potente es su prueba estadística.√σn−−√
Aquí hay una pequeña simulación en R para demostrar la relación entre un error estándar y la desviación estándar de las medias de muchas muchas repeticiones del experimento inicial. En este caso, comenzaremos con una media poblacional de 100 y una desviación estándar de 15.
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
Observe cómo la desviación estándar final está cerca del error estándar teórico. Al jugar con la variable n aquí, puede ver que la medida de variabilidad se reducirá a medida que n aumente.
[Como comentario aparte, la curtosis en los gráficos no está cambiando realmente (suponiendo que sean distribuciones normales). Bajar la varianza no cambia la curtosis, pero la distribución se verá más estrecha. La única forma de examinar visualmente los cambios de curtosis es colocar las distribuciones en la misma escala.]