¿Cuál es la distribución de la distancia euclidiana entre dos variables aleatorias normalmente distribuidas?


41

Suponga que se le dan dos objetos cuyas ubicaciones exactas se desconocen, pero se distribuyen de acuerdo con distribuciones normales con parámetros conocidos (por ejemplo, y b N ( v , t ) ) . Podemos suponer estos son ambos normales bivariantes, de manera que las posiciones se describen mediante una distribución de más de ( x , Y ) de coordenadas (es decir, m y v son vectores que contienen las esperadas ( x , y ) coordenadas para unaaN(m,s)sinorte(v,t))(X,y)metrov(X,y)unay si respectivamente). También asumiremos que los objetos son independientes.

¿Alguien sabe si la distribución de la distancia euclidiana al cuadrado entre estos dos objetos es una distribución paramétrica conocida? ¿O cómo derivar el PDF / CDF para esta función analíticamente?


44
Debe obtener un múltiplo de una distribución de chi-cuadrado no central siempre que las cuatro coordenadas no estén correlacionadas. De lo contrario, el resultado parece mucho más complicado.
whuber

@whuber cualquier detalle / puntero que pueda proporcionar sobre cómo los parámetros de la distribución de chi-cuadrado no central resultante se relacionan con los de los objetos a, b sería fantástico
Nick

44
@Nick los primeros párrafos del artículo de Wikipedia proporcionan los detalles. Al observar las funciones características, puede establecer que un resultado similar no está disponible cuando no todas las variaciones son iguales o hay algunas correlaciones.
whuber

@ Nick, solo para aclarar, ¿tanto una como si son vectores aleatorios con valores en R2 ?
mpiktas

1
@Nick, si y b son conjuntamente normales, entonces la diferencia es a - b también es normal. Entonces su problema es encontrar la distribución del vector normal aleatorio. Googleé encontré este enlace . El documento describe un problema mucho más complejo que, en un caso muy particular, coincide con el suyo. Esto da cierta esperanza de que haya una respuesta definitiva a su pregunta. Las referencias pueden darle más ideas sobre dónde buscar. unasiuna-si
mpiktas

Respuestas:


24

La respuesta a esta pregunta se puede encontrar en el libro Formas cuadráticas en variables aleatorias de Mathai y Provost (1992, Marcel Dekker, Inc.).

Como aclaran los comentarios, necesita encontrar la distribución de donde z = a - b sigue una distribución normal bivariada con media μ y matriz de covarianza Σ . Esta es una forma cuadrática en la variable aleatoria bivariada z .Q=z12+z22z=una-siμΣz

Brevemente, un buen resultado general para el caso -dimensional donde z N p ( μ , Σ ) y Q = p j = 1 z 2 j es que la función generadora de momento es E ( e t Q ) = e t p j = 1 b 2 j λ jpagsznortepags(μ,Σ)

Q=j=1pagszj2
, dondeλ1,...,λpson los valores propios deΣybes una función lineal deμ. Consulte el Teorema 3.2a.2 (página 42) en el libro citado anteriormente (asumimos aquí queΣno es singular). Otra representación útil es 3.1a.1 (página 29) Q=pj=1
mi(mitQ)=mitj=1pagssij2λj1-2tλjj=1pags(1-2tλj)-1/ /2
λ1,...,λpagsΣsiμΣ donde u 1 , ... , u p son iid N ( 0 , 1 ) .
Q=j=1pagsλj(tuj+sij)2
tu1,...,tupagsnorte(0 0,1)

Todo el Capítulo 4 del libro está dedicado a la representación y el cálculo de las densidades y las funciones de distribución, lo cual no es para nada trivial. Solo estoy familiarizado superficialmente con el libro, pero mi impresión es que todas las representaciones generales están en términos de expansiones de series infinitas.

λ1,λ2>0 0si1,si2R

unasiuna-si


1
Gracias por la referencia, encontré el libro y lentamente estoy tratando de abrirme paso
Nick

λj=σ2p=2bj2λjμj2

sijμj2

7

μre=μ1-μ2Σre=Σ1+Σ2 Σre=JΣ12JTΣ12=[Σ1Σ2]J=[+yo,-yo]

En segundo lugar, busque la distribución de la longitud del vector de diferencia, o la distancia radial desde el origen, que se distribuye Hoyt :

El radio alrededor de la media verdadera en una variable aleatoria normal correlacionada bivariada con variaciones desiguales, reescrita en coordenadas polares (radio y ángulo), sigue una distribución de Hoyt. El pdf y el cdf se definen en forma cerrada, la búsqueda de raíz numérica se usa para encontrar cdf ^ −1. Se reduce a la distribución de Rayleigh si la correlación es 0 y las varianzas son iguales.

Una distribución más general surge si permite una diferencia sesgada (origen desplazado), de Ballistipedia : Distribuciones de coordenadas xy y el error radial resultante


2
+1, pero creo que vale la pena señalar que la pregunta trata de lo que su figura llama el "Caso general".
ameba dice Reinstate Monica

1

¿Por qué no probarlo?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

Parcela 1 Parcela 2 Parcela 3 Parcela 4


2
Los comentarios de Whubers a la pregunta original ya indicaron cómo se vería si las variaciones fueran las mismas y las variables no estuvieran correlacionadas. Quizás dar un ejemplo de dónde este no es el caso sería más esclarecedor.
Andy W

¿Puedes dar ese ejemplo?
Brandon Bertelsen el

todo lo que necesita hacer es generar los valores xey que están correlacionados o tienen diferentes variaciones. Las diferentes variaciones se pueden hacer directamente en el código tal como está. Puede generar valores a partir de una matriz de covarianza especificada utilizando mvrnorm del paquete MASS. Además, no estoy seguro de cuál es la función "dentista" en el código anterior, en caso de que sea "densidad".
Andy W

1
Dicho esto, probablemente sea igual de esclarecedor trabajar con las matemáticas para ver por qué este es el caso (y cómo la manipulación de la varianza / covarianzas cambiará la distribución). No está del todo claro para mí por qué este es el caso simplemente mirando la función característica mencionada por whuber. Parece que una simple comprensión de las reglas para sumar, restar y multiplicar variables aleatorias lo ayudará a comprender por qué.
Andy W
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.