¿Qué tipo de distribución es esta?


8

Me enfrenté a una distribución limitante con cero covarianza entre dos variables, pero su correlación es 1. ¿Existe tal distribución? ¿Cómo se puede explicar?


Tienes razón, necesito dar más detalles. OK, X e Y son distribución normal bivariada con diferentes varianzas y medias (sin n) pero corr = 1- (1 / n), ahora investigue la distribución limitante de Yn | Xn = x.


24
Esa distribución se llama error computacional .
HA SALIDO - Anony-Mousse

55
Proporcione los detalles para resolver la aparente discrepancia. Cuales son las circunstancias?
Glen_b -Reinstate Monica

Proporcione aún más detalles sobre la distribución conjunta de Xn y Yn. En particular, lo que está dando lugar aρn=11/n?
Mico

Lamentablemente, no tengo más detalles. Tu pregunta es una pregunta en la que estaba pensando también. ¿Cómo ρn depende de n cuando las varianzas están libres de n? y que significa exactamente
Behgol

¿Por qué crees que la covarianza es 0?
Juho Kokkala

Respuestas:


5

Después de una aclaración de la OP, parece que a) suponemos que las dos variables siguen conjuntamente una normal bivariada yb) nuestro interés está en la distribución condicional, que es entonces

YnXn=x  N(μy+σyσxρn(xμx),(1ρn2)σy2)

Entonces vemos eso como n, tenemos ρn1, y la varianza de la distribución condicional va a cero. Intuitivamente, si la correlación va a la unidad, "sabiendox"es suficiente para" saber y" además.

Pero en ninguna parte de lo anterior obtenemos eso Cov(Yn,Xn)es cero Incluso en el límite, la covarianza seguirá siendo igual aCov(Yn,Xn)σyσx.

Tenga en cuenta que la covarianza condicional (y luego también la correlación condicional) siempre es cero, porque,

Cov(Yn,XnXn=x)=E(YnXnXn=x)E(YXn=x)E(XXn=x)

=xE(YnXn=x)xE(YXn=x)=0

Esto sucede porque al examinar Xn=x Hemos convertido una de las variables aleatorias en una constante, y las constantes no varían conjuntamente con nada.


Gracias por tu respuesta. Entonces, ¿es una distribución normal sin varianza? ¿Cómo sería su forma?
Behgol


20

Dado que la covarianza depende de la escala de X y Y y la correlación no (reescalada a [1,1]) es posible. Por ejemplo, si la varianza disminuye hacia cero:

Si X=Y y σx2 es la varianza de X, entonces limσx20cov(X,Y)=0y .limσx20cor(X,Y)=1

Nota 1: cuando la correlación está estrictamente indefinida porque su denominador sería igual a 0.σx2=0


Puede que tenga razón, debería darle más detalles. OK X e Y son distribución normal bivariante con diferente varianza y media (libre de n) pero corr = 1- (1 / n), ahora investigue la distribución limitante de Yn | Xn = x.
Behgol

La frase "Dado que la covarianza depende de la escala" implica que esto se da en la pregunta. Sin embargo, eso parece ser más de lo que la pregunta implica. Me parece que está postulando que esto podría ser así, con conclusiones declaradas. Corrígeme si eso está mal.
Nick Cox

18

Por lo que puedo ver (quizás fuera de algunas circunstancias especiales, pero no mencionas ninguna), no es posible.

La correlación es la covarianza dividida por el producto de las dos desviaciones estándar, por lo que si la covarianza es cero, la correlación es cero (cuando ambas desviaciones estándar no son cero) o indefinida (cuando al menos una desviación estándar es 0). No debe ser 1 cuando la covarianza es 0.

Espero que haya cometido algún error en su análisis o que su descripción no sea lo suficientemente clara para discernir la situación correctamente.


1

Probablemente tenga dificultades porque visualiza los datos como gaussianos.

Es posible que todos los datos representen el mismo punto (aunque sería redundante) y que tenga dos variables con diferentes nombres (alias entre sí) que comprenden los datos. Esto llevaría a una covarianza cero, y una correlación de 1 como fundamental, la covarianza representa la dispersión de los datos en el espacio de características, mientras que la correlación representa cuánto depende una variable de otra o el grado de influencia que tienen entre sí. Si los datos no se extienden, la covarianza debe ser cero.

NOTA Sin embargo, lo mejor que puede hacer con un conjunto de datos de este tipo es simplemente predecir que todos los puntos tienen la misma salida, lo que probablemente dará un alto sesgo


2
Parece que hay muchas cosas diferentes en esta respuesta, y me cuesta ver la relación. Por ejemplo, ¿cómo es relevante el párrafo 1? ¿Cómo es relevante el párrafo 3? Además, ¿cómo se llega a cero covarianza en el párrafo 2?
Richard Hardy

Gracias @Richard Hardy por señalarlo. Una de las otras respuestas sugirió inicialmente una solución gaussiana. Es por eso que el párrafo 1. En el párrafo 3, solo estoy dando mi opinión sobre lo que puede hacer con ese conjunto de datos. Básicamente, la covarianza representa la dispersión de los datos en el espacio de características. Si los datos no se extienden en, entonces la covarianza debe ser cero. También agregué esto a la respuesta
RS Nikhil Krishna
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.