La tendencia central, la propagación y la asimetría pueden definirse relativamente bien, al menos de manera intuitiva; Las medidas matemáticas estándar de estas cosas también corresponden relativamente bien a nuestras nociones intuitivas. Pero la curtosis parece ser diferente. Es muy confuso y no coincide bien con ninguna intuición sobre la forma de distribución.
Una explicación típica de la curtosis en un entorno aplicado sería este extracto de las estadísticas aplicadas para negocios y administración usando Microsoft Excel [ 1 ] :
La curtosis se refiere a cuán alta es una distribución o, por el contrario, qué tan plana es. Si hay más valores de datos en las colas, de lo que espera de una distribución normal, la curtosis es positiva. Por el contrario, si hay menos valores de datos en las colas, de lo que cabría esperar en una distribución normal, la curtosis es negativa. Excel no puede calcular esta estadística a menos que tenga al menos cuatro valores de datos.
Además de la confusión entre "curtosis" y "curtosis excesiva" (como en este libro, es común usar la primera palabra para referirse a lo que otros autores llaman la segunda), la interpretación en términos de "pico" o "planitud" luego se confunde con el cambio de atención a cuántos elementos de datos hay en las colas. Teniendo en cuenta tanto "pico" y "colas" es necesario - Kaplansky [ 2 ]se quejó en 1945 de que muchos libros de texto de la época afirmaban erróneamente que la curtosis tenía que ver con qué tan alto se compara el pico de la distribución con el de una distribución normal, sin considerar las colas. Pero claramente tener que considerar la forma tanto en el pico como en las colas hace que la intuición sea más difícil de comprender, un punto que el extracto citado anteriormente omite al pasar del pico a la pesadez de las colas como si estos conceptos fueran los mismos.
Además, esta explicación clásica de "cumbres y colas" de la curtosis solo funciona bien para distribuciones simétricas y unimodales (de hecho, los ejemplos ilustrados en ese texto son todos simétricos). Sin embargo, la forma general "correcta" de interpretar la curtosis, ya sea en términos de "picos", "colas" u "hombros", ha sido discutida durante décadas . [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ]
¿Existe una forma intuitiva de enseñar curtosis en un entorno aplicado que no golpee contradicciones o contraejemplos cuando se adopta un enfoque más riguroso? ¿Es la curtosis incluso un concepto útil en el contexto de este tipo de cursos de análisis de datos aplicados, a diferencia de las clases de estadística matemática? Si el "pico" de una distribución es un concepto intuitivamente útil, ¿deberíamos enseñarlo a través de L-moments [ 7 ] en su lugar?
Herkenhoff, L. y Fogli, J. (2013). Estadística aplicada para negocios y administración usando Microsoft Excel. Nueva York, NY: Springer.
Kaplansky, I. (1945). "Un error común con respecto a la curtosis". Revista de la Asociación Americana de Estadística,40(230): 259.
Darlington, Richard B (1970). "¿Es la curtosis realmente 'pico'?". El estadístico estadounidense24(2): 19–22
Moros, JJA. (1986) "El significado de la curtosis: Darlington reexaminado". El estadístico estadounidense40(4): 283–284
Balanda, Kevin P. y MacGillivray, HL (1988). "Kurtosis: una revisión crítica". El estadístico estadounidense 42(2): 111–119
DeCarlo, LT (1997). "Sobre el significado y uso de la curtosis". Métodos psicológicos,2(3), 292. Chicago
Hosking, JRM (1992). "¿Momentos o momentos L? Un ejemplo que compara dos medidas de forma distributiva". El estadístico estadounidense46(3): 186-189