El enlace en cuestión también habla de SAS. Pero, de hecho, nada en esta pregunta, excepto posiblemente el propio enfoque del afiche, lo limita a esos programas nombrados en particular.
Creo que necesitamos separar aquí diferentes tipos de problemas, algunos de los cuales son ilusorios y otros genuinos.
Algunos programas restan 3 y otros no, de modo que la medida de curtosis informada es 3 para variables gaussianas / normales sin resta y 0 con resta. He visto personas desconcertadas por eso, a menudo cuando la diferencia resulta ser 2.999 y no exactamente 3.
Algunos programas usan factores de corrección diseñados para garantizar que la curtosis se calcule sin sesgos. Estos factores de corrección se aproximan a 1 a medida que el tamaño de la muestra aumenta . Como la curtosis no se estima bien en muestras pequeñas de ninguna manera, esto no debería ser motivo de gran preocupación.norte
Entonces, hay un pequeño problema con las fórmulas, ya que el n. ° 1 es mucho más grande que el n. ° 2, pero ambos son menores si se comprenden. El consejo claramente es mirar la documentación del programa que está utilizando, y si no hay documentación que explique ese tipo de detalles para abandonar ese programa de inmediato. Pero un caso de prueba tan simple como una variable (1, 2) produce una curtosis de 1 o 4 dependiendo del # 1 solo (sin factor de corrección).
La pregunta luego se refiere a la interpretación, pero este es un asunto mucho más abierto y contencioso.
Antes de llegar al área principal de discusión, una dificultad a menudo informada pero poco conocida es que las estimaciones de curtosis están limitadas en función del tamaño de la muestra. Escribí una reseña en Cox, NJ 2010. Los límites de la asimetría de la muestra y la curtosis. Stata Journal 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Resumen: La asimetría de la muestra y la curtosis están limitadas por las funciones del tamaño de la muestra. Los límites, o aproximaciones a ellos, se han redescubierto en varias ocasiones durante las últimas décadas, pero, sin embargo, parecen ser poco conocidos. Los límites imparten sesgo a la estimación y, en casos extremos, implican que ninguna muestra podría dar testimonio exacto de su distribución original. Los principales resultados se explican en una revisión tutorial, y se muestra cómo Stata y Mata pueden usarse para confirmar y explorar sus consecuencias.
Ahora, a lo que comúnmente se considera el meollo del asunto:
Muchas personas traducen la curtosis como pico, pero otros enfatizan que a menudo sirve como una medida del peso de la cola. De hecho, las dos interpretaciones podrían ser ambas palabras razonables para algunas distribuciones. Es casi inevitable que no haya una interpretación verbal simple de la curtosis: nuestro lenguaje no es lo suficientemente rico en las comparaciones de sumas de cuartos poderes de desviaciones de las medias y sumas de segundos poderes de los mismos.
En un clásico menor, que a menudo se pasa por alto, Irving Kaplansky (1945a) llamó la atención sobre cuatro ejemplos de distribuciones con diferentes valores de curtosis y comportamientos no consistentes con algunas discusiones sobre curtosis.
Xc = π--√
( 1 ) ( 1 / 3 c ) ( 9 / 4 + x 4 4) exp( - x2)
( 2 ) ( 3 / ( c 8 -√) ) exp( - x2/ 2)-(1 / 6c)(9 / 4+ x4 4) exp( - x2)
( 3 ) ( 1 / 6 c ) ( exp ( - x2/ 4)+4exp( - x2) )
( 4 ) ( 3 3 -√/ 16c)(2+ x2) exp( - 3 x2/ 4)
≈
Es instructivo trazar estas densidades. Los usuarios de Stata pueden descargar mi kaplansky
programa desde SSC. Usar una escala logarítmica para la densidad puede ayudar.
Sin revelar todos los detalles, estos ejemplos socavan cualquier historia simple de que la curtosis baja o alta tiene una interpretación clara en términos de pico o incluso de cualquier otro contraste único.
Si el nombre de Irving Kaplansky suena, es probable que conozcas su trabajo en álgebra moderna. Él (1917-2006) fue un matemático canadiense (luego estadounidense) y enseñó e investigó en Harvard, Chicago y Berkeley, con un año de guerra en el Grupo de Matemáticas Aplicadas del Consejo de Defensa Nacional de la Universidad de Columbia. Kaplansky realizó importantes contribuciones a la teoría de grupos, la teoría de los anillos, la teoría de álgebras de operadores y la teoría de campos. Fue un consumado pianista y letrista y un entusiasta y lúcido expositor de las matemáticas. Tenga en cuenta también algunas otras contribuciones a la probabilidad y las estadísticas de Kaplansky (1943, 1945b) y Kaplansky y Riordan (1945).
Kaplansky, I. 1943. Una caracterización de la distribución normal. Annals of Mathematical Statistics 14: 197-198.
Kaplansky, I. 1945a. Un error común con respecto a la curtosis. Revista, Asociación Americana de Estadística 40: 259 solamente.
Kaplansky, I. 1945b. La distribución asintótica de corridas de elementos consecutivos. Anales de Estadística Matemática 16: 200-203.
Kaplansky, I. y Riordan, J. 1945. Emparejamiento múltiple y ejecuciones por el método simbólico. Anales de Estadística Matemática 16: 272-277.