Creo que la mediana media.
¿Es este el caso?
Creo que la mediana media.
¿Es este el caso?
Respuestas:
Es una pregunta no trivial (seguramente no es tan trivial como parece pensar la gente que hace la pregunta).
En última instancia, la dificultad es causada por el hecho de que realmente no sabemos qué queremos decir con 'asimetría'; muchas veces es algo obvio, pero a veces realmente no lo es. Dada la dificultad de precisar lo que queremos decir con 'ubicación' y 'propagación' en casos no triviales (por ejemplo, la media no siempre es lo que queremos decir cuando hablamos de ubicación), no debería ser una gran sorpresa que una respuesta más sutil concepto como asimetría es al menos tan resbaladizo. Esto nos lleva a probar varias definiciones algebraicas de lo que queremos decir, y no siempre están de acuerdo entre sí.
1) Si mide la asimetría por el segundo coeficiente de asimetría de Pearson , entonces la media ( ) será menor que la mediana ( ∼ , es decir, en este caso la tiene al revés).
La segunda asimetría de Pearson (población) es y será negativo ("sesgo izquierdo") cuando μ < ∼ μ
Las versiones de muestra de estas estadísticas funcionan de manera similar.
La razón de la relación necesaria entre la media y la mediana en este caso es porque así es como se define la medida de asimetría.
Aquí hay una densidad sesgada a la izquierda (tanto por la segunda medida de Pearson como por la medida más común en (2) a continuación):
La mediana está marcada en el margen inferior en verde, la media en rojo.
Así que espero la respuesta que quieren que des. es que la media es menor que la mediana. Suele ser el caso con los tipos de distribuciones a las que solemos dar nombres.
(Pero siga leyendo y vea por qué eso no es realmente correcto como una declaración general).
2) Si lo mide por el tercer momento estandarizado más habitual , a menudo es, pero no siempre, el caso de que la media sea menor que la mediana.
Es decir, es posible construir ejemplos donde lo opuesto es cierto, o donde una medida de asimetría es cero mientras que la otra no es cero.
Es decir, no hay necesidad relación entre las ubicaciones de la media, la mediana y la asimetría del momento.
Considere, por ejemplo, la siguiente muestra (el mismo ejemplo puede construirse como una distribución de probabilidad discreta):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
Sin embargo, el coeficiente de asimetría (Fisher, tercer momento) es negativo (es decir, por sus luces, tenemos datos de asimetría hacia la izquierda) ya que la suma de los cubos de las desviaciones de la media es negativa.
Entonces, en ese caso, sesgo a la izquierda, pero significa> mediana.
(Por otro lado, si cambia 2.7 en el ejemplo anterior a 3, entonces tiene un ejemplo donde la asimetría de momento es cero, pero la media excede la mediana. Si lo hace 3.3, entonces la asimetría de momento es positiva , y la media excede la mediana, es decir, finalmente está en la dirección 'anticipada').
Si usa el primer sesgo de Pearson en lugar de cualquiera de las definiciones anteriores, tiene un problema similar a este caso: la dirección del sesgo no determina la relación entre la media y la mediana en general.
Editar: en respuesta a una pregunta en los comentarios, un ejemplo en el que la media y la mediana son iguales, pero la asimetría del momento es negativa. Considere los siguientes datos (como antes, también cuenta como un ejemplo para una población discreta; considere escribir los números en las caras de un dado).
1 5 6 6 8 10
la media y la mediana son ambas 6, pero la suma de cubos de desviaciones de la media es negativa, por lo que la asimetría del tercer momento es negativa.
No. Los datos sesgados a la izquierda tienen una cola larga a la izquierda (extremo bajo), por lo que la media generalmente será menor que la mediana. (Pero vea la respuesta de @Glen_b para una excepción). Casualmente, creo que los datos que "parecen" sesgados tendrán un significado menor que la mediana.
Los datos sesgados a la derecha son más comunes; por ejemplo, ingresos. Allí la media es mayor que la mediana.
Código R
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001