Limite la diferencia entre la correlación de Spearman y la correlación de Kendall


9

Estoy tratando de demostrar o refutar que la diferencia entre la Correlación de Spearman y la Correlación de Kendall no es más de 1 (o menos, cuanto más estricta, mejor).

Supongo que no hay vínculos.

En un intento de refutar el resultado usando un ejemplo de contador, verifiqué todas las posibilidades de vectores con longitud 8. Obtuve algunas imágenes bonitas pero ningún ejemplo de contador:

diferencia:

La diferencia nunca es más de 0.4 en este caso, así que creo que es cierto, pero no pude probarlo.


1
Hay una publicación muy interesante que podría ser un duplicado parcial de su pregunta. Es "Kendall Tau o Spearman rho? Stats.stackexchange.com/questions/3943/kendall-tau-or-spearmans-rho.
Michael R. Chernick

1
Para aquellos que quieran abordar un enfoque algebraico directo, creo que el resultado se puede obtener en dos pasos. Primero (el paso clave), muestre que el valor absoluto extremo de la diferencia se alcanza para los datos
(1,n),(2,n1),,(n,1),(n+1,2n),(n+2,2n1),,(2n,n+1)
para 2n puntos y
(1,n+1),(2,n),,(n+1,1),(n+2,2n+1),(n+3,2n),,(2n+1,n+2)
para 2n+1puntos. Luego calcule las diferencias para estos conjuntos de datos. (En el primer caso hay otro máximo y en el segundo caso hay otros tres máximos implicados por simetrías obvias.)
whuber

2
@Glen_b Si estoy en lo correcto, entonces la diferencia absoluta máxima para datos de longitud n es
2(n2)n2n2n(n21),
que tiene un valor límite de 1/2 (desde abajo) como n.Eso apoya lo que escribiste. Esta fórmula está relacionada con A111384 , cuyos valores se dividen porn(n21)/4.
whuber

1
Ese límite parece coincidir con su fórmula incluso para n (y sus casos límite en el comentario anterior ciertamente coinciden con los obtenidos mediante un cálculo exhaustivo para todos los pequeños nvalores que podría verificar fácilmente, pero espero que ya lo haya hecho). Es interesante que el límite sea 1/2. ¿Cometí un error en el extraño caso n? (editar: No, ahora veo, estaba justo aparte de manipular su fórmula)
Glen_b -Reinstate Monica

2
@Glen_b Un límite de1/2 es intuitivo: para los patrones que describí, Spearman está cerca de 1/2 mientras Kendall es O(1/n). El álgebra se simplifica generalizando mi enfoque de "crayón" a la covarianza. Aquí está el Rcódigo que implementa las fórmulas relevantes. Los argumentos consisten en dos permutaciones de 1:n. Spearman : function(x, y) mean(outer(x, x, '-') * outer(y, y, '-')) * 6 / (length(x)^2 - 1) Kendall :function(x,y) mean(sign(outer(x, x, '-')) * sign(outer(y, y, '-'))) * (1 + 1/(length(x)-1))
whuber

Respuestas:


0

¡Quizás quieras mirar este artículo ! Y otros trabajos de estos autores. No recuerdo exactamente dónde, pero he visto tu primer gráfico en sus documentos, y algunas pruebas junto con él. Creo que esto se puede hacer aprovechando las cópulas (como Kendall tau y Spearman rho se pueden escribir en función de la cópula subyacente entre las dos variables). Espero eso ayude.

C es la cópula de (X,Y).

τ(X,Y)=40101C(u,v)c(u,v)dudv1

(La correlación de Kendall es la expectativa de la cópula reescalada en [0,1])

ρ(X,Y)=120101C(u,v)dudv3

Entonces, |τρ|


2
El artículo es una buena referencia para las técnicas que exhibe. Sin embargo, no parece contener un resultado que pueda implicar fácilmente el conjeturado en esta pregunta. Esto se debe principalmente a que sus resultados no son universales: se aplican bajo varias condiciones restrictivas e incluso solo en el límite a medida que la distribución conjunta se acerca a la independencia.
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.