¿Hay límites en la correlación de Spearman de una suma de dos variables?


8

Dados -vectores modo que el coeficiente de correlación de Spearman de e es , ¿existen límites conocidos en el coeficiente de Spearman de con , en términos de ( , presumiblemente)? Es decir, ¿se pueden encontrar funciones (no triviales) modo que x , y 1 , y 2 x y i ρ i = ρ ( x , y i ) x y 1 + y 2 ρ i n l ( ρ 1 , ρ 2 , n ) , u ( ρ 1 , ρ 2 , n ) l ( ρ 1 , ρ 2 , n )nx,y1,y2xyiρi=ρ(x,yi)xy1+y2ρinl(ρ1,ρ2,n),u(ρ1,ρ2,n)

l(ρ1,ρ2,n)ρ(x,y1+y2)u(ρ1,ρ2,n)

edit : según el ejemplo de @ whuber en el comentario, parece que en el caso general, solo se pueden establecer los límites triviales . Por lo tanto, me gustaría imponer aún más la restricción:l=1,u=1

  • y1,y2 son permutaciones de los enteros .1n

2
Solo conociendo , el intervalo que contiene debe incluir y : para cada podría tener valores muy pequeños (a la vez que tiene cualquier orden de clasificación) y, por lo tanto, simplemente "fluctúa" los valores en cuando se agrega a . Por lo tanto, el orden de clasificación de no se vería afectado. No sé si el intervalo puede exceder el . ρ ( x , y 1 + y 2 ) ρ 1 ρ 2 y 1 , y 2 y 1 y 1 y 1 ρ iρ1,ρ2ρ(x,y1+y2)ρ1ρ2y1,y2y1y1y1ρi
caracal

2
@caracal Buenas observaciones. El intervalo definitivamente puede ser más amplio que : solo considere el caso en que ambas correlaciones son cero. La correlación con la suma puede ser fácilmente distinta de cero: puede variar de -1 a 1. Por ejemplo, x = (1,2,3,4,5); y1 = (3, -10,2,10,1); y2 = (-8,9, -2, -9,4); y1 + y2 = (-5, -1,0,1,5) tiene pero . ρ 1 = ρ 2 = 0 ρ = 1ρiρ1=ρ2=0ρ=1
whuber

@whuber: esto parece implicar que solo existen límites triviales (es decir, ). Quizás tenga que arrojar otra restricción al problema. l=1,u=1
shabbychef

@shabbychef No, has publicado un buen problema: no es trivial. En el caso de que , por ejemplo, la única posibilidad es ρ = 1 . Sospecho que los límites no son triviales, excepto cuando ρ 1 = ρ 2 = 0 ; deben estrecharse a medida que ρ 1 y ρ 2 se acercan a ± 1 . ρ1=ρ2=1ρ=1ρ1=ρ2=0ρ1ρ2±1
whuber

1
Aquí hay otro caso patológico. Supongamos que e y 1 = - y 2 . Entonces ρ ( x , y 1 + y 2 ) = 0 , pero ρ 1 = 1 y ρ 2 = - 1 . Puede ser esclarecedor pensar en una versión más simple y probabilística del problema. Deje X , Y 1 e Y 2x=y1y1=y2ρ(x,y1+y2)=0ρ1=1ρ2=1XY1Y2ser variables aleatorias, cada una con distribuciones marginalmente uniformes. Ahora dejemos que sea ​​el CDF de Y 1 + Y 2 . ¿Qué podemos decir sobre C o v ( X , G ( Y 1 + Y 2 ) ) basado en C o v ( X , Y 1 ) y C o v ( X , Y 2 ) ? GY1+Y2Cov(X,G(Y1+Y2))Cov(X,Y1)Cov(X,Y2)
vqv

Respuestas:


4

La correlación de rango de Spearman es solo la correlación producto-momento de Pearson entre los rangos de las variables. La restricción adicional de Shabbychef significa que e y 2 son iguales a sus rangos y que no hay vínculos, por lo que tienen la misma desviación estándar σ y (digamos). Si también reemplazamos x por sus rangos, el problema se convierte en el problema equivalente para la correlación momento-producto de Pearson. Por definición de la correlación producto-momento de Pearson, ρ ( x , y 1 + y 2 )y1y2σy
Para cualquier conjunto de tres variables, si conocemos dos de sus tres correlaciones, podemos poner límites en la tercera correlación (ver, por ejemplo,Vos 2009, o dela fórmula para correlación parcial): ρ1ρ2-

ρ(X,y1+y2)=Cov(X,y1+y2)σXVar(y1+y2)=Cov(X,y1)+Cov(X,y2)σXVar(y1)+Var(y2)+2Cov(y1,y2)=ρ1σXσy+ρ2σXσyσX2σy2+2σy2ρ(y1,y2)=ρ1+ρ22(1+ρ(y1,y2))1/ /2.
Por lo tanto, ρ 1 + ρ 2
ρ1ρ2-1-ρ121-ρ22ρ(y1,y2)ρ1ρ2+1-ρ121-ρ22
si ρ1+ρ20; siρ1+ρ20necesita cambiar los límites.
ρ1+ρ22(1+ρ1ρ2+1-ρ121-ρ22)1/ /2ρ(X,y1+y2)ρ1+ρ22(1+ρ1ρ2-1-ρ121-ρ22)1/ /2
ρ1+ρ20 0ρ1+ρ20 0

Pero el verdadero problema es que los rangos no suman. Ver mi comentario a la pregunta.
vqv

@vqv pero si e y 2 son permutaciones de los enteros 1 ... n, entonces son exactamente iguales a sus rangos. y1y21...norte
onestop

la mitad de la suma de permutaciones no necesita ser una permutación; Pero esto está muy cerca y creo que responde la pregunta de Pearson.
shabbychef

y1+y2y1+y2y1y21,...,nortey1=(1,2,3,4 4)y2=(2,3,1,4 4)y1+y2=(3,5 5,4 4,8)runanortek(y1+y2)=(1,3,2,4 4)y1+y2runanortek(y1+y2)ρ(X,y1+y2)=Cov(X,y1+y2)/ / y1y2

@vqv Tienes toda la razón. Fui demasiado apresurado para intentar una respuesta antes de partir para las vacaciones de Navidad. No había encontrado esa desigualdad relacionada con la correlación de Pearson de tres variables antes. Aquí hay otra referencia completa con visualizaciones en 3D: jstor.org/stable/2684832 . Todavía creo que podría tener cierta relevancia, por lo que no eliminaré mi respuesta, aunque tampoco veo cómo solucionarlo.
onestop
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.