¿En qué casos uno debería preferir el uno sobre el otro?
Encontré a alguien que reclama una ventaja para Kendall, por razones pedagógicas , ¿hay otras razones?
¿En qué casos uno debería preferir el uno sobre el otro?
Encontré a alguien que reclama una ventaja para Kendall, por razones pedagógicas , ¿hay otras razones?
Respuestas:
Descubrí que la correlación de Spearman se usa principalmente en lugar de la correlación lineal habitual cuando se trabaja con puntajes enteros en una escala de medición, cuando tiene un número moderado de puntajes posibles o cuando no queremos confiar en suposiciones sobre las relaciones bivariadas . En comparación con el coeficiente de Pearson, la interpretación de la tau de Kendall me parece menos directa que la del rho de Spearman, en el sentido de que cuantifica la diferencia entre el% de pares concordantes y discordantes entre todos los posibles eventos por pares. En mi opinión, el tau de Kendall se parece más a Goodman-Kruskal Gamma .
Acabo de leer un artículo de Larry Winner en J. Statistics Educ. (2006) que analiza el uso de ambas medidas, NASCAR Winston Cup Race Results for 1975-2003 .
También encontré interesante la respuesta de @onestop sobre la correlación de Pearson o Spearman con datos no normales a este respecto.
De nota, tau de Kendall (la una versión) tiene la conexión a Somers' D (y C de Harrell) usado para el modelado predictivo (véase, por ejemplo, Interpretación de Somers' D en cuatro modelos simples de RB Newson y la referencia 6 en la misma, y los artículos de Newson publicado en el Stata Journal 2006). Se proporciona una descripción general de las pruebas de suma de rango en Cálculo eficiente de los intervalos de confianza de Jackknife para estadísticas de rango , que se publicó en el JSS (2006).
Me refiero al honorable caballero a mi respuesta anterior : "... los intervalos de confianza para la r S de Spearman son menos confiables y menos interpretables que los intervalos de confianza para los parámetros τ de Kendall", según Kendall y Gibbons (1990).
De nuevo respuesta algo filosófica; la diferencia básica es que el Rho de Spearman es un intento de extender la idea R ^ 2 (= "explicación de la varianza") sobre las interacciones no lineales, mientras que la Tau de Kendall pretende ser un estadístico de prueba para la prueba de correlación no lineal. Entonces, Tau debe usarse para probar correlaciones no lineales, Rho como extensión R (o para personas familiarizadas con R ^ 2; explicar Tau a un público desprevenido en un tiempo limitado es doloroso).
Aquí hay una cita de Andrew Gilpin (1993) abogando por el τ de Kendall sobre el ρ de Spearman por razones teóricas:
"[De Kendall ] se aproxima a una distribución normal más rápidamente que , como , el tamaño de la muestra, se incrementa, y también es más manejable matemáticamente, en particular cuando los lazos están presentes."
Gilpin, AR (1993). Tabla de conversión de Tau de Kendall a Rho de Spearman dentro de las medidas de contexto de la magnitud del efecto para el metanálisis. Medición educativa y psicológica, 53 (1), 87-92.
FWIW, una cita de Myers & Well (diseño de investigación y análisis estadísticos, segunda edición, 2003, p. 510). Si todavía te importan los valores p;
Seigel y Castellan (1988, estadísticas no paramétricas para las ciencias del comportamiento) señalan que, aunque y Spearman generalmente tendrán valores diferentes cuando se calculan para el mismo conjunto de datos, cuando las pruebas de significación para y Spearman se basan en sus distribuciones de muestreo darán los mismos valores p .