Distribución del máximo de dos variables normales correlacionadas


Respuestas:


22

Según Nadarajah y Kotz, 2008 , Distribución exacta del máximo / mínimo de dos variables aleatorias gaussianas , el PDF de parece serX=max(X1,X2)

f(x)=2ϕ(x)Φ(1r1r2x),

donde es el PDF y es el CDF de la distribución normal estándar.ΦϕΦ

ingrese la descripción de la imagen aquí


¿Cómo se ve esto si (sin correlación en absoluto)? Tengo problemas para visualizarlo. r=0
Mitch

3
Agregué una figura visualizando la distribución. Parece un gaussiano exprimido ligeramente sesgado a la derecha.
Lucas

22

Sea el PDF normal bivariado para con marginales estándar y correlación . El CDF del máximo es, por definición, ( X , Y ) ρfρ(X,Y)ρ

Pr(max(X,Y)z)=Pr(Xz, Yz)=zzfρ(x,y)dydx.

El PDF normal bivariado es simétrico (por reflexión) alrededor de la diagonal. Por lo tanto, aumentar a agrega dos franjas de probabilidad equivalente al cuadrado semi-infinito original: el superior infinitamente grueso es mientras que su contraparte reflejada, el franja derecha, es .z + d z ( - , z ] × ( z , z + d z ] ( z , z + d z ] × ( - , z ]zz+dz(,z]×(z,z+dz](z,z+dz]×(,z]

Figura

La densidad de probabilidad de la franja derecha es la densidad de en veces la probabilidad condicional total de que esté en la franja, . La distribución condicional de siempre es Normal, por lo que para encontrar esta probabilidad condicional total solo necesitamos la media y la varianza. La media condicional de en es la predicción de regresión y la varianza condicional es la varianza "inexplicada" .z Y Pr ( Y zXzYY Y X ρ X var ( Y ) - var ( ρ X ) = 1 - ρ 2Pr(Yz|X=z)YYXρXvar(Y)var(ρX)=1ρ2

Ahora que conocemos la media y la varianza condicionales, se puede obtener el CDF condicional de dado estandarizando y aplicando el estándar Normal CDF :YXYΦ

Pr(Yy|X)=Φ(yρX1ρ2).

La evaluación de esto en y y la multiplicación por la densidad de en (un estándar normal pdf ) da la densidad de probabilidad de la segunda franja (derecha)y=zX=zXzϕ

ϕ(z)Φ(zρz1ρ2)=ϕ(z)Φ(1ρ1ρ2z).

Duplicar esto explica la franja superior equi-probable, dando el PDF del máximo como

ddzPr(max(X,Y)z)=2ϕ(z)Φ(1ρ1ρ2z).

Recapitulación

He coloreado los factores para indicar sus orígenes: para las dos tiras simétricas; para los anchos de tira infinitesimales; y para las longitudes de la tira. El argumento de este último, , es solo una versión estandarizada de condicional en .2ϕ(z)Φ()1ρ1ρ2zY=zX=z


¿Se puede extender a más de dos variables normales estándar con una matriz de correlación dada?
A. Donda

1
@ A.Donda Sí, pero la expresión se vuelve más complicada. Con cada nueva dimensión viene la necesidad de integrarse una vez más.
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.