¿Intuición por momentos sobre la media de una distribución?

¿Puede alguien proporcionar una intuición sobre por qué los momentos más altos de una distribución de probabilidad , como el tercer y cuarto momento, corresponden a asimetría y curtosis respectivamente? Específicamente, ¿por qué la desviación sobre la media elevada a la tercera o cuarta potencia termina traduciéndose en una medida de asimetría y curtosis? ¿Hay alguna manera de relacionar esto con la tercera o cuarta derivada de la función? $p_X$

Considere esta definición de asimetría y curtosis:

\begin{matrix} Skewness (X) = E [(X - μ_{X})^{3}] / σ^{3}, \\ Kurtosis (X) = E [(X - μ_{X})^{4}] / σ^{4} . \end{matrix}

$\begin{matrix} \text{Skewness}(X) = \mathbb{E}[(X - \mu_{X})^3] / \sigma^3, \\[6pt] \text{Kurtosis}(X) = \mathbb{E}[(X - \mu_{X})^4] / \sigma^4. \\[6pt] \end{matrix}$

En estas ecuaciones elevamos el valor normalizado $(X-\mu)/\sigma$ a una potencia y tomamos su valor esperado. No me queda claro por qué elevar la variable aleatoria normalizada a la potencia de cuatro da "pico" o por qué elevar la variable aleatoria normalizada a la potencia de tres debería dar "sesgo". ¡Esto parece mágico y misterioso!

— usuario248237
fuente

Mi intuición al sesgar es notar que el tercer poder conserva los negativos. Entonces, si tiene desviaciones negativas más grandes de la media que las positivas (en pocas palabras), entonces termina con una distribución sesgada negativa. Mi intuición para la curtosis es que la cuarta potencia amplifica grandes desviaciones de la media mucho más que la segunda potencia. Es por eso que pensamos en la curtosis como una medida de qué tan gordas son las colas de una distribución. Tenga en cuenta que las posibilidades muy grandes de x de la media mu se elevan a la cuarta potencia, lo que las amplifica pero ignora el signo.

— wolfsatthedoor

Ver stats.stackexchange.com/questions/84158/…

— whuber

Dado que los poderes 4 son mucho más afectados por los valores atípicos que los poderes 1, espero que ganes poco mirando el cuarto momento sobre la mediana, al menos si el objetivo era la robustez.

— Glen_b -Reinstala a Monica el

Primero, tenga en cuenta que estos momentos superiores no son necesariamente medidas buenas / confiables de asimetría / pico. Dicho esto, creo que las vigas dan una buena intuición física durante los primeros tres momentos, por ejemplo, media = balance / escala del haz , varianza = flexión en voladizo , asimetría = balancín .

— GeoMatt22

Tienes razón, la interpretación de la curtosis como medida de "pico" es mágica y misteriosa. Eso es porque no es del todo cierto. La curtosis no te dice absolutamente nada sobre el pico. Mide solo las colas (valores atípicos). Es fácil demostrar matemáticamente que las observaciones cercanas al pico contribuyen con una cantidad minúscula a la medida de curtosis, independientemente de si el pico es plano, puntiagudo, bimodal, sinusoidal o acampanado.

— Peter Westfall

Respuestas:

Hay una buena razón para estas definiciones, que se vuelve más clara cuando observa la forma general de los momentos de variables aleatorias estandarizadas. Para responder a esta pregunta, primero considerar la forma general de la º estandarizada momento central : $n$ $^\dagger$

ϕ_{n} = E [(\frac{X - E [X]}{S [X]})^{n}] .

$\phi_n = \mathbb{E} \Bigg[ \Bigg( \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg)^n \text{ } \Bigg].$

Los primeros dos momentos centrales estandarizados son los valores y , que se mantienen para todas las distribuciones para las cuales la cantidad anterior está bien definida. Por lo tanto, podemos considerar los momentos centrales estandarizados no triviales que ocurren para los valores . Para facilitar nuestro análisis definimos: $\phi_1=0$ $\phi_2=1$ $n \geqslant 3$

\begin{aligned} ϕ_{n}^{+} & = E [| \frac{X - E [X]}{S [X]} |^{n} | X > E [X]] \cdot P (X > E [X]), \\ ϕ_{n}^{-} & = E [| \frac{X - E [X]}{S [X]} |^{n} | X < E [X]] \cdot P (X < E [X]) . \end{aligned}

$\begin{equation} \begin{aligned} \phi_n^+ &= \mathbb{E} \Bigg[ \Bigg| \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg|^n \text{ } \Bigg| X > \mathbb{E}[X] \Bigg] \cdot \mathbb{P}(X > \mathbb{E}[X]), \\[8pt] \phi_n^- &= \mathbb{E} \Bigg[ \Bigg| \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg|^n \text{ } \Bigg| X < \mathbb{E}[X] \Bigg] \cdot \mathbb{P}(X < \mathbb{E}[X]). \end{aligned} \end{equation}$

Estas son cantidades no negativos que dan la º absoluta de potencia de la condicional variable aleatoria estandarizada con que sea por encima o por debajo de su valor esperado. Ahora descompondremos el momento central estandarizado en estas partes. $n$

Los valores impares de miden el sesgo en las colas: $n$ para cualquier valor impar de tenemos una potencia impar en la ecuación de momento y así podemos escribir el momento central estandarizado como . De esta forma vemos que el momento central estandarizada nos da la diferencia entre el º poder absoluto de la variable aleatoria estandarizada, sujeto a que quede por encima o por debajo de su media, respectivamente. $n \geqslant 3$ $\phi_n = \phi_n^+ - \phi_n^-$ $n$

Por lo tanto, para cualquier potencia impar obtendremos una medida que proporcione valores positivos si la potencia absoluta esperada de la variable aleatoria estandarizada es mayor para valores superiores a la media que para valores inferiores a la media, y da valores negativos si se espera la potencia absoluta es menor para valores superiores a la media que para valores inferiores a la media. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "asimetría", con potencias más altas que otorgan mayor peso relativo a valores que están lejos de la media. $n \geqslant 3$

Dado que este fenómeno ocurre para cada poder impar , la elección natural para una medida arquetípica de "asimetría" es definir como asimetría. Este es un momento central estandarizado más bajo que los poderes impares más altos, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central estandarizado como la asimetría , ya que es el momento central estandarizado más bajo que mide este aspecto de la distribución. (Los poderes impares más altos también miden los tipos de asimetría, pero con un énfasis cada vez mayor en valores lejos de la media). $n \geqslant 3$ $\phi_3$

Los valores pares de miden la gordura de las colas: $n$ para cualquier valor par de tenemos una potencia par en la ecuación de momento y así podemos escribir el momento central estandarizado como . De esta forma vemos que el momento central estandarizada nos da la suma de los º poder absoluto de la variable aleatoria estandarizada, sujeto a que quede por encima o por debajo de su media, respectivamente. $n \geqslant 3$ $\phi_n = \phi_n^+ + \phi_n^-$ $n$

Por lo tanto, para cualquier potencia uniforme obtendremos una medida que proporcione valores no negativos, con valores más altos si las colas de la distribución de la variable aleatoria estandarizada son más gordas. Tenga en cuenta que este es un resultado con respecto a la variable aleatoria estandarizada , por lo que un cambio de escala (cambio de la varianza) no tiene efecto en esta medida. Más bien, es efectivamente una medida de la gordura de las colas, después de estandarizar la variación de la distribución. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "curtosis", con potencias más altas que otorgan mayor peso relativo a valores que están lejos de la media. $n \geqslant 3$

Dado que este fenómeno ocurre para cada potencia par , la elección natural para una medida arquetípica de curtosis es definir como la curtosis. Este es un momento central estandarizado más bajo que los poderes pares más altos, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central estandarizado como la "curtosis", ya que es el momento central estandarizado más bajo que mide este aspecto de la distribución. (Los poderes pares más altos también miden los tipos de curtosis, pero con un énfasis cada vez mayor en valores lejos de la media). $n \geqslant 3$ $\phi_4$

$^\dagger$ Esta ecuación está bien definida para cualquier distribución cuyos dos primeros momentos existan y que tenga una varianza distinta de cero. Asumiremos que la distribución de intereses cae en esta clase para el resto del análisis.

— Ben - Restablece a Monica
fuente

Pregunta similar ¿ Qué es tan 'momento' sobre 'momentos' de una distribución de probabilidad? Di una respuesta física a lo que abordaba los momentos.

"La aceleración angular es la derivada de la velocidad angular, que es la derivada del ángulo con respecto al tiempo, es decir, . Considere que el segundo momento es análogo al torque aplicado a un movimiento circular, o si va a realizar una aceleración / desaceleración (también segunda derivada) de ese movimiento circular (es decir, angular, ). Del mismo modo, el tercer momento ser una tasa de cambio de torque, y así sucesivamente por momentos aún más altos para hacer tasas de cambio de tasas de cambio de tasas de cambio, es decir, derivadas secuenciales de movimiento circular ... " $\dfrac{d\omega}{dt}=\alpha,\,\dfrac{d\theta}{dt}=\omega$ $\theta$

Vea el enlace ya que esto es quizás más fácil de visualizar con ejemplos físicos.

La asimetría es más fácil de entender que la curtosis. Una asimetría negativa es una cola izquierda más pesada (o una dirección negativa más atípica) que a la derecha y una asimetría positiva lo contrario.

Wikipedia cita a Westfall (2014) e implica que la curtosis alta surge ya sea para variables aleatorias que tienen valores atípicos o para funciones de densidad con una o dos colas pesadas, al tiempo que afirma que cualquier tendencia central de datos o densidad tiene un efecto relativamente pequeño sobre el valor de la curtosis. Los valores bajos de curtosis implicarían lo contrario, es decir, la falta de valores atípicos del eje la relativa ligereza de ambas colas. $x$

— Carl
fuente

La asimetría es el punto de equilibrio del pdf de , y la curtosis es el punto de equilibrio del pdf de . Ambas transformaciones "estiran" las colas, curtosis más. Si el pdf de cae a la derecha cuando se coloca un punto de apoyo en 0, entonces hay un sesgo positivo en la distribución original. Si el pdf de cae a la derecha cuando se coloca un punto de apoyo en 3.0, entonces la distribución original tiene una cola más gruesa que la distribución normal. Aquí, "peso de las colas" se refiere más precisamente al apalancamiento que a la masa. La interpretación de los moros no es del todo correcta en ambas menciones de "concentración".

Z^{3}

$Z^3$

Z^{4}

$Z^4$

Z^{3}

$Z^3$

Z^{4}

$Z^4$

— Peter Westfall

@PeterWestfall Estoy de acuerdo en que la interpretación de los moros es imperfecta. El lenguaje preciso no se puede lograr fácilmente sin ser también confuso. Tome "apalancamiento" por ejemplo. Apalancamiento significa primer momento y uno tendría que inventar algo como "apalancamiento apalancado" para el segundo momento, lo que podría confundir más que iluminar. Su enfoque parece inventar un concepto novedoso, es decir, "apalancamiento extendido", que sugiere transformaciones geométricas para las cuales uno también podría afirmar que algunos defensores lo favorecen como autoconsistentes a riesgo de ser controvertidos y no físicos para otros. .

— Carl

"Apalancamiento" se refiere al primer momento de la variable , donde . No es una ciencia exacta.

U

$U$

U = Z^{4}

$U = Z^4$

— Peter Westfall

@PeterWestfall Para no ser demasiado mezquino, pero estás aprovechando el apalancamiento. Claro, todavía puede usar la palabra, y si no fuera un objeto de cuarta dimensión, en comparación con una distancia unidimensional, , incluso podría ser útil. El contexto aquí es el de los momentos y la creación de un modelo físico para los momentos. Hay varias formas de hacerlo, por ejemplo, vea mi respuesta al respecto aquí . En otras palabras, para poner los momentos en cualquier contexto físico, tenemos que hacer más que agitar las manos e invocar la cuarta dimensión.

Z^{4}

$Z^4$

Z

$Z$

— Carl

@PeterWestfall En el contexto del movimiento circular, llamaríamos al momento de torsión del segundo momento , y no al apalancamiento de , que este último, aunque no es incorrecto, no nos recuerda nada físico.

Z^{2}

$Z^2$

— Carl