¿Cómo funciona el error estándar?

17

He estado investigando el funcionamiento interno del error estándar recientemente, y me encontré incapaz de entender cómo funciona. Entiendo que el error estándar es que es la desviación estándar de la distribución de medias muestrales. Mis preguntas son:

• ¿Cómo sabemos que el error estándar es la desviación estándar de las medias de la muestra cuando generalmente tomamos una sola muestra?

• ¿Por qué la ecuación para calcular el error estándar no refleja la ecuación de desviación estándar para una sola muestra?

standard-error

— luciano
fuente

Cuando dice "muestra única", ¿se refiere a un conjunto de muestras o realmente a un tamaño de muestra de 1?

— Erik

1

Estos se explican por un problema simple pero interesante (una respuesta ternaria) en lenguaje simple y no estadístico en stats.stackexchange.com/a/18609 .

— whuber

13

Sí, el error estándar de la media (SEM) es la desviación estándar (SD) de las medias. (El error estándar es otra forma de decir SD de una distribución de muestreo. En este caso, la distribución de muestreo es la media para muestras de un tamaño fijo, digamos N.) Existe una relación matemática entre el SEM y la población SD: SEM = población SD / la raíz cuadrada de N. Esta relación matemática es muy útil, ya que casi nunca tenemos una estimación directa de la SEM pero sí tenemos una estimación de la SD de la población (es decir, la SD de nuestra muestra). En cuanto a su segunda pregunta, si tuviera que recolectar múltiples muestras de tamaño N y calcular la media para cada muestra, podría estimar el SEM simplemente calculando la DE de las medias. Entonces, la fórmula para SEM sí refleja la fórmula para el SD de una sola muestra.

— Joel W.
fuente

13

Supongamos que son independientes e idénticamente distribuidos. Esta es la situación a la que estoy bastante seguro de que te refieres. Deje que su media común sea y su varianza común sea . $X_1, X_2, \ldots, X_n$ $\mu$ $\sigma^2$

Ahora la media muestral es . La linealidad de la expectativa muestra que la media de también es . El supuesto de independencia implica que la varianza de es la suma de las varianzas de sus términos. Cada uno de estos términos tiene una varianza (porque la varianza de una constante por una variable aleatoria es la constante al cuadrado por la varianza de la variable aleatoria). Tenemos $X_b=\sum_i X_i/n$ $X_b$ $\mu$ $X_b$ $X_i/n$ $\sigma^2/n^2$ $n$ distribuyó idénticamente tales variables para sumar, por lo que cada término tiene esa misma varianza. Como resultado, obtenemos para la varianza de la media muestral. $n \sigma^2/n^2 = \sigma^2/n$

Por lo general, no conocemos por lo que debemos estimarlo a partir de los datos. Dependiendo de la configuración, hay varias formas de hacerlo. Las dos estimaciones de uso general más comunes de son la varianza muestral $\sigma^2$ $\sigma^2$ y un pequeño múltiplo, $s^2 = \frac{1}{n}\sum_i(X_i-X_b)^2$ (que es un estimador imparcial de). El uso de cualquiera de estos en lugar deen el párrafo anterior y tomar la raíz cuadrada da el error estándar en forma de $s_u^2 = \frac{n}{n-1}s^2$ $\sigma^2$ $\sigma^2$ o $s/\sqrt{n}$ . $s_u/\sqrt{n}$

— Michael R. Chernick
fuente

1

Esto es muy bueno. ¿Tiene sugerencias para libros o lecturas para desarrollar una línea similar de habilidades de pensamiento? Gracias.

— q126y

Elegante respuesta!

— Jinhua Wang

7

σ_{\bar{x}}^{2} = \frac{σ_{p o p}^{2}}{n_{j}},

$\sigma^2_{\bar x}=\frac{\sigma^2_{pop}}{n_j},$

σ_{p o p}^{2}

$\sigma^2_{pop}$

n_{j}

$n_j$

F

$F$

F = \frac{n_{j} \times s_{\bar{x}}^{2}}{s_{pooled within group}^{2}}

$F=\frac{n_j\times s^2_{\bar x}}{s^2_{\text{pooled within group}}}$ In this case, we really would be using the standard formula (only applied over the group means), that is:

s_{\bar{x}}^{2} = \frac{\sum_{j = 1}^{n_{j}} ({\bar{x}}_{j} - {\bar{x}}_{.})^{2}}{n_{j} - 1},

$s^2_{\bar x}=\frac{\sum_{j=1}^{n_j}(\bar x_j-\bar x_.)^2}{n_j-1},$ with

x_{.}

$x_.$ being the mean of the group means.

In that we typically believe the null hypothesis is not true, @JoelW.'s point is right, but I work through this point, because I think the clarity it affords is helpful for understanding these issues.

— gung - Reinstate Monica
fuente

2

I think your comment is basically the same as this one, which was written with less mathematical notation: stats.stackexchange.com/questions/32206/…

— Joel W.