¿Por qué la media tiende a ser más estable en diferentes muestras que la mediana?


22

La Sección 1.7.2 de Descubriendo Estadísticas Usando R por Andy Fields, et all, mientras enumera las virtudes de la media frente a la mediana, establece:

... la media tiende a ser estable en diferentes muestras.

Esto después de explicar las muchas virtudes de la mediana, por ej.

... La mediana no se ve afectada por puntajes extremos en ninguno de los extremos de la distribución ...

Dado que la mediana no se ve afectada por las puntuaciones extremas, habría pensado que sería más estable en todas las muestras. Así que me sorprendió la afirmación de los autores. Para confirmar, ejecuté una simulación: generé 1M de números aleatorios y tomé muestras de 100 números 1000 veces y calculé la media y la mediana de cada muestra y luego calculé el SD de esas medias y medianas de muestra.

nums = rnorm(n = 10**6, mean = 0, sd = 1)
hist(nums)
length(nums)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10**3) { b = sample(x=nums, 10**2); medians[i]= median(b); means[i]=mean(b) }
sd(means)
>> [1] 0.0984519
sd(medians)
>> [1] 0.1266079
p1 <- hist(means, col=rgb(0, 0, 1, 1/4))
p2 <- hist(medians, col=rgb(1, 0, 0, 1/4), add=T)

Como puede ver, los medios están más estrechamente distribuidos que las medianas.

ingrese la descripción de la imagen aquí

En la imagen adjunta, el histograma rojo es para medianas, como puede ver, es menos alto y tiene una cola más gruesa, lo que también confirma la afirmación del autor.

¡Sin embargo, estoy asombrado por esto! ¿Cómo puede la mediana que es más estable tiende a variar más entre las muestras? Parece paradójico! Cualquier idea sería apreciada.


1
Sí, pero pruébelo tomando muestras de nums <- rt (n = 10 ** 6, 1.1). Esa distribución t1.1 dará un montón de valores extremos, no necesariamente equilibrados entre positivo y negativo (una oportunidad tan buena de obtener otro valor extremo positivo como un valor extremo negativo para equilibrar), lo que causará una variación gigantesca en . Esto es contra lo que se escuda la mediana. Es poco probable que la distribución normal proporcione valores especialmente extremos para extender la distribución más amplia que la mediana. x¯x¯
Dave

10
La declaración del autor no es generalmente cierta. (Hemos recibido muchas preguntas aquí relacionadas con errores en los libros de este autor, por lo que esto no es una sorpresa.) Los contraejemplos estándar se encuentran entre las "distribuciones estables" , donde la media es cualquier cosa menos "estable" (en cualquier sentido razonable de el término) y la mediana es mucho más estable.
whuber

1
"... la media tiende a ser estable en diferentes muestras". Es una afirmación sin sentido. La "estabilidad" no está bien definida. La media (muestra) es bastante estable en una sola muestra porque es una cantidad no aleatoria. Si los datos son "inestables" (¿altamente variables?), La media también es "inestable".
AdamO

1
Es probable que esta pregunta sea respondida por los análisis detallados ofrecidos en stats.stackexchange.com/questions/7307 , en los que la misma pregunta se hace de una manera específica (donde el sentido de "estable" está bien definido).
whuber

2
Intenta reemplazar rnormcon rcauchy.
Eric Towers

Respuestas:


3

La mediana es máximamente robusta a los valores atípicos, pero altamente susceptible al ruido. Si introduce una pequeña cantidad de ruido en cada punto, entrará en la mediana sin amortiguar siempre que el ruido sea lo suficientemente pequeño como para no cambiar el orden relativo de los puntos. Por cierto, es al revés. El ruido se promedia, pero un solo valor atípico puede cambiar la media arbitrariamente.

Su prueba mide principalmente la robustez frente al ruido, pero puede crear fácilmente una donde la mediana funcione mejor. Si desea un estimador que sea robusto tanto para los valores atípicos como para el ruido, simplemente deseche el tercio superior e inferior y promedie el resto.


¿Hay un nombre más específico para este algoritmo que "la media recortada del 33% "?
David Cary

25

Como @whuber y otros han dicho, la declaración no es cierta en general. Y si estás dispuesto a ser más intuitivo, no puedo seguir el ritmo de los geeks matemáticos profundos por aquí, podrías ver otras maneras en que la media y la mediana son estables o no. Para estos ejemplos, suponga un número impar de puntos para que pueda mantener mis descripciones consistentes y simples.

  1. Imagine que tiene una extensión de puntos en una recta numérica. Ahora imagine que toma todos los puntos por encima del centro y los mueve hasta 10 veces sus valores. La mediana no ha cambiado, la media se movió significativamente. Entonces la mediana parece más estable.

  2. Ahora imagine que estos puntos están bastante extendidos. Mueva el punto central hacia arriba y hacia abajo. Un movimiento de una unidad cambia la mediana en uno, pero apenas mueve la media. La mediana ahora parece menos estable y más sensible a pequeños movimientos de un solo punto.

  3. Ahora imagine tomar el punto más alto y moverlo suavemente desde el punto más alto al más bajo. La media también se moverá suavemente. Pero la mediana no se moverá continuamente: no se moverá en absoluto hasta que su punto más alto sea más bajo que la mediana anterior, luego comenzará a seguir el punto hasta que vaya por debajo del siguiente punto, luego la mediana se mantendrá en ese punto y nuevamente no No te muevas mientras continúas moviendo tu punto hacia abajo. [Editado por comentario]

Entonces, las diferentes transformaciones de sus puntos hacen que la media o la mediana se vean menos suaves o estables en algún sentido. Los expertos en matemáticas aquí le han mostrado distribuciones de las que puede probar, que se asemejan más a su experimento, pero es de esperar que esta intuición también ayude.


1
Con respecto al ítem 3: ¿La mediana no se movería también suavemente? Digamos que el conjunto inicial de puntos es [1, 3, 5, 7, 9]. Inicialmente la mediana es 5. Esa seguirá siendo la mediana hasta que el quinto punto (inicialmente 9) caiga por debajo 5, en ese punto la mediana seguirá suavemente el quinto punto a medida que disminuya, hasta que golpee 3, en ese punto la mediana se mantendrá 3. Entonces, aunque el punto que define la mediana es "saltar" (desde el tercer punto, hasta el quinto punto, hasta el segundo punto), el valor real de la mediana no tiene salto / discontinuidad.
Scott M

@ScottM Pareces tener razón. No estoy seguro de por qué pensé que saltaría. Reformularé cuando tenga la oportunidad.
Wayne

18

nμσ2<fmf~f~(z)=σf(μ+σz)zR. La varianza asintótica de la media muestral y la mediana muestral están dadas respectivamente por:

V(X¯n)=σ2nV(X~n)σ2n14f~(mμσ)2.

Por lo tanto tenemos:

V(X¯n)V(X~n)4f~(mμσ)2.

n

V(X¯n)<V(X~n)ff~(mμσ)<12.

nf=1/2π=0.3989423<1/2


¡Increíble! Gracias.
Alok Lal

4

Comentario: solo para hacer eco de su simulación, utilizando una distribución para la cual las SD de medios y medianas tienen el resultado opuesto:

Específicamente, numsahora son de una distribución de Laplace (también llamada 'doble exponencial'), que puede simularse como la diferencia de dos distribuciones exponenciales con la misma tasa (aquí la tasa predeterminada 1). [Quizás vea Wikipedia en distribuciones de Laplace.]

set.seed(2019)
nums = rexp(10^6) - rexp(10^6)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10^3) { b = sample(x=nums, 10^2); 
  medians[i]= median(b); means[i]=mean(b) }
sd(means)
[1] 0.1442126
sd(medians)
[1] 0.1095946   # <-- smaller

hist(nums, prob=T, br=70, ylim=c(0,.5),  col="skyblue2")
 curve(.5*exp(-abs(x)), add=T, col="red")

enter image description here

Nota: Otra posibilidad fácil, mencionada explícitamente en el enlace de @ whuber, es Cauchy, que puede simularse como distribución t de Student con un grado de libertad rt(10^6, 1). Sin embargo, sus colas son tan pesadas que hacer un buen histograma es problemático.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.