¿Por qué la curtosis de una distribución normal es 3 en lugar de 0?


18

¿Qué significa la afirmación de que la curtosis de una distribución normal es 3. ¿Significa que en la línea horizontal, el valor de 3 corresponde a la probabilidad máxima, es decir, 3 es el modo del sistema?

Cuando miro una curva normal, parece que el pico ocurre en el centro, también conocido como 0. Entonces, ¿por qué la curtosis no es 0 y en su lugar 3?


66
Como escribe @Glen_b, el coeficiente de "curtosis" se ha definido como el cuarto momento estandarizado: Sucede que para la distribución normal, entonces . El exceso de curtosis generalmente denotado por es . Se debe tener cuidado porque a veces los autores escriben "curtosis" y significan "curtosis en exceso".
β2=mi[(X-μ)4 4](mi[(X-μ)2])2=μ4 4σ4 4
μ4 4=3σ4 4β2=3γ2γ2=β2(Normal)3
Alecos Papadopoulos

1
Re: Mi comentario anterior. La expresión correcta para el coeficiente de curtosis en exceso es
γ2=β2β2(Normal)=β23
Alecos Papadopoulos

Respuestas:


29

La curtosis ciertamente no es el lugar donde está el pico. Como dices, eso ya se llama modo.

La curtosis es el cuarto momento estandarizado: si , es una versión estandarizada de la variable que estamos viendo, entonces la curtosis poblacional es la cuarta potencia promedio de esa variable estandarizada; E(Z4). La curtosis de la muestra está correspondientemente relacionada con la cuarta potencia media de un conjunto estandarizado de valores de muestra (en algunos casos se escala por un factor que va a 1 en muestras grandes).Z=X-μσmi(Z4 4)

Como observa, este cuarto momento estandarizado es 3 en el caso de una variable aleatoria normal. Como Alecos señala en los comentarios, algunas personas definen curtosis como ; eso a veces se llama exceso de curtosis (también es el cuarto acumulativo). Al ver la palabra 'curtosis' debe tener en cuenta esta posibilidad de que diferentes personas usen la misma palabra para referirse a dos cantidades diferentes (pero estrechamente relacionadas).E(Z4)3

La curtosis generalmente se describe como pico * (por ejemplo, cuán curvadamente curva es el pico, que presumiblemente fue la intención de elegir la palabra "curtosis") o de cola pesada (a menudo lo que la gente está interesada en usarlo para medir), pero en De hecho, el cuarto momento estandarizado habitual no mide ninguna de esas cosas.

De hecho, el primer volumen de Kendall y Stuart da contraejemplos que muestran que una curtosis más alta no está necesariamente asociada con un pico más alto (en una variable estandarizada) o colas más gruesas (de manera bastante similar que el tercer momento no mide lo que muchas personas creo que sí).

Sin embargo, en muchas situaciones hay cierta tendencia a asociarse con ambos, ya que a menudo se observa un mayor pico y una gran cola cuando la curtosis es mayor; simplemente debemos tener cuidado al pensar que es necesariamente el caso.

La curtosis y la asimetría están fuertemente relacionadas (la curtosis debe ser al menos 1 más que el cuadrado de la asimetría; la interpretación de la curtosis es algo más fácil cuando la distribución es casi simétrica.

ingrese la descripción de la imagen aquí

Darlington (1970) y Moors (1986) mostraron que la medida del cuarto momento de la curtosis es, en efecto, la variabilidad sobre "los hombros" - , y Balanda y MacGillivray (1988) sugieren pensar en términos vagos relacionados con ese sentido ( y considere otras formas de medirlo). Si la distribución está muy concentrada alrededor de μ ± σ , entonces la curtosis es (necesariamente) pequeña, mientras que si la distribución se extiende lejos de μ ± σ (lo que tenderá a apilarla simultáneamente en el centro y mover la probabilidad hacia las colas en para alejarlo de los hombros), la curtosis del cuarto momento será grande.μ±σμ±σμ±σ

De Carlo (1997) es un punto de partida razonable (después de recursos más básicos como Wikipedia) para leer sobre curtosis.

Editar: veo algunas preguntas ocasionales sobre si un pico máximo (valores cercanos a 0) puede afectar la curtosis en absoluto. La respuesta es sí, definitivamente puede. Que este sea el caso es una consecuencia de ser el cuarto momento de una variable estandarizada: para aumentar el cuarto momento de una variable estandarizada, debe aumentar mientras mantiene constante E ( Z 2 ) . Esto significa que el movimiento de probabilidad más adentro de la cola debe ir acompañado de algo más adentro (adentro ( - 1 , 1 )E(Z4)E(Z2) (1,1)); y viceversa: si pones más peso en el centro mientras mantienes la varianza en 1, también pones algo en la cola.

[NB como se discutió en los comentarios, esto es incorrecto como una declaración general; aquí se requiere una declaración algo diferente.]

Este efecto de la variación que se mantiene constante está directamente relacionado con la discusión de la curtosis como "variación sobre los hombros" en los documentos de Darlington y Moors. Ese resultado no es una noción manual, sino una simple equivalencia matemática: no se puede sostener que es de otra manera sin tergiversar la curtosis.

(1,1)(1,1)

[Mi inclusión de Kendall y Stuart en las referencias se debe a que su discusión sobre la curtosis también es relevante en este punto.]

Entonces, ¿qué podemos decir? La curtosis a menudo se asocia con un pico más alto y con una cola más pesada, sin tener que ocurrir tampoco marchitarse. Ciertamente es más fácil levantar la curtosis jugando con la cola (ya que es posible alejarse más de 1 sd) y luego ajustando el centro para mantener constante la varianza, pero eso no significa que el pico no tenga impacto; seguramente lo hace, y uno puede manipular la curtosis enfocándose en ella. La curtosis se asocia en gran medida pero no solo con el peso de la cola; nuevamente, observe la variación sobre el resultado de los hombros; en todo caso, eso es lo que está mirando la curtosis, en un sentido matemático inevitable.

Referencias

Balanda, KP y MacGillivray, HL (1988),
"Kurtosis: una revisión crítica".
Estadístico estadounidense 42 , 111-119.

Darlington, Richard B. (1970),
"¿Es la curtosis realmente un" pico "?"
Estadístico estadounidense 24 , 19-22.

Moors, JJA (1986),
"El significado de la curtosis: Darlington reexaminado".
Estadístico estadounidense 40 , 283-284.

DeCarlo, LT (1997),
"Sobre el significado y el uso de la curtosis".
Psychol Métodos, 2 , 292-307.

Kendall, MG y A. Stuart,
The Advanced Theory of Statistics ,
vol. 1, 3ª ed.
(Ediciones más recientes tienen Stuart y Ord)


0 03

1
Vale la pena considerar el artículo de Westfall sobre curtosis, titulado Kurtosis como pico, 1905-2014 RIP. Critica a DeCarlo (entre otros, incluso mencionados anteriormente) por difundir el conocimiento de la curtosis como una medida de pico. Enlace aquí: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Lil'Lobster

1
@ Lil Creo que Westfall exagera su caso. Al centrarse (casi) por completo en colas pesadas, es estrictamente incorrecto. Si bien la curtosis se asocia con bastante fuerza a las colas pesadas, es evidente que la curtosis no es una cola pesada (los contraejemplos donde las colas más pesadas van con curtosis más baja son fáciles de encontrar, como se cubre en algunas de las referencias anteriores; también son fáciles de hacer). La curtosis se asocia menos fuertemente con el pico, pero todavía hay una asociación allí; Al insistir en que no es el pico, va demasiado lejos en sus críticas (críticas similares se aplican a sus propias conclusiones). ...
ctd

1
Glen_b, tú y yo amamos las matemáticas. Si me va a criticar por "exagerar mi caso", por favor deme su argumento matemático que conecte la curtosis de Pearson con el "pico".
Peter Westfall

1
Gelen_b, tu comentario "Esto significa que el movimiento de probabilidad más adentro de la cola debe ir acompañado de algo más dentro de mu + - sigma y viceversa - si pones más peso en el centro mientras mantienes la varianza en 1, también pones algo en la cola "Es falso. No debe Puede mantener constante la probabilidad (de hecho, toda la distribución) dentro de mu + - sigma y aumentar la curtosis al infinito dentro de ciertas familias paramétricas de distribuciones. Ver aquí: math.stackexchange.com/questions/167656/…
Peter Westfall

2

Aquí hay una visualización directa para entender a qué se refiere el número "3" con respecto a la curtosis de la distribución normal.

Dejar X estar normalmente distribuido y dejar Z=(X-μ)/ /σ. DejarV=Z4 4. Considere la gráfica del pdf deV, pagV(v). Esta curva está a la derecha de cero, y se extiende hasta el infinito, con 0.999 cuantil 117.2, pero gran parte de la masa está cerca de cero; por ejemplo, 68% menos que 1.0.

La media de esta distribución es la curtosis. Una forma común de entender la media es como el "punto de equilibrio" del gráfico pdf. SiX es normal, esta curva pagV(v) saldos a 3.0.

Esta representación también explica por qué la curtosis mide el peso de las colas de una distribución. SiX no es normal, la curva pagV(v) "cae a la derecha" cuando la curtosis es mayor que 3.0, y en este caso la densidad de Xse puede decir que tiene "cola más gruesa que la distribución normal". Del mismo modo, la curvapagV(v) "cae a la izquierda" cuando la curtosis es menor que 3.0, y en este caso la densidad de X se puede decir que tiene "cola más ligera que la distribución normal".

Se cree comúnmente que una curtosis más alta se refiere a más masa cerca del centro (es decir, más masa cerca de 0 en el pdf pagV(v)) Si bien en muchos casos esto es cierto, obviamente no es la masa (posiblemente aumentada) cerca de cero lo que hace que el gráfico "caiga hacia la derecha" en el caso de curtosis alta. Es en cambio el apalancamiento de la cola.

Desde este punto de vista, la interpretación esencialmente correcta del "peso de la cola" de la curtosis podría caracterizarse más específicamente como "apalancamiento de la cola" para evitar confundir "mayor peso de la cola" con "mayor masa en la cola". Después de todo, es posible que una curtosis más alta corresponda a menos masa en la cola, pero donde esta masa disminuida ocupa una posición más distante.

"Dame el lugar donde pararme, y moveré la tierra". -Arquímedes

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.