Podemos resolver este problema analíticamente usando alguna intuición geométrica y argumentos . Desafortunadamente, la respuesta es bastante larga y un poco desordenada.
Configuración básica
Primero, expongamos alguna notación. Supongamos que dibujamos puntos al azar uniformemente desde el rectángulo . Suponemos sin pérdida de generalidad que . Deje que sean las coordenadas del primer punto y las coordenadas del segundo punto. Entonces, , , e son mutuamente independientes con distribuido uniformemente en e distribuido uniformemente en .[0,a]×[0,b]0<b<a(X1,Y1)(X2,Y2)X1X2Y1Y2Xi[0,a]Yi[0,b]
Considere la distancia euclidiana entre los dos puntos. Esto es
dondey.
D=(X1−X2)2+(Y1−Y2)2−−−−−−−−−−−−−−−−−−−√=:Z21+Z22−−−−−−−√,
Z1=|X1−X2|Z2=|Y1−Y2|
Distribuciones triangulares
Como y son uniformes independientes, entonces tiene una distribución triangular, de dondetiene una distribución con función de densidad
La función de distribución correspondiente es para . Del mismo modo,tiene densidad y función de distribución .X1X2X1−X2Z1=|X1−X2|
fa(z1)=2a2(a−z1),0<z1<a.
Fa(z1)=1−(1−z1/a)20≤z1≤aZ2=|Y1−Y2|fb(z2)Fb(z2)
Tenga en cuenta que dado que es una función solo de los dos y es solo una función de , y son independientes. Entonces, la distancia entre los puntos es la norma euclidiana de dos variables aleatorias independientes (con diferentes distribuciones).Z1XiZ2YiZ1Z2
El panel izquierdo de la figura muestra la distribución de y el panel derecho muestradonde en este ejemplo.X1−X2Z1=|X1−X2|a=5
Alguna probabilidad geométrica
Por lo tanto, y son independientes y se admiten en y respectivamente. Para fijo , la función de distribución de la distancia euclidiana es
Z1Z2[0,a][0,b]d
P(D≤d)=∬{z21+z22≤d2}fa(z1)fb(z2)dz1dz2.
Podemos pensar en esto geométricamente como una distribución en el rectángulo y considerando un cuarto de círculo de radio . Nos gustaría saber la probabilidad que hay dentro de la intersección de estas dos regiones. Hay tres posibilidades diferentes a considerar:[0,a]×[0,b]d
Región 1 (naranja): . Aquí el cuarto de círculo se encuentra completamente dentro del rectángulo.0≤d<b
Región 2 (rojo): . Aquí el cuarto de círculo intersecta el rectángulo a lo largo de los bordes superior e inferior.b≤d≤a
Región 3 (azul): . El cuarto de círculo intersecta el rectángulo a lo largo de los bordes superior y derecho.a<d≤a2+b2−−−−−−√
Aquí hay una figura, donde dibujamos un radio de ejemplo de cada uno de los tres tipos. El rectángulo está definido por , . El mapa de calor en escala de grises dentro del rectángulo muestra la densidad donde las áreas oscuras tienen mayor densidad y las áreas más claras tienen menor densidad. Al hacer clic en la figura, se abrirá una versión más grande de la misma.a=5b=4fa(z1)fb(z2)dz1dz2
Un cálculo feo
Para calcular las probabilidades, necesitamos hacer algunos cálculos. Consideremos cada una de las regiones a su vez y veremos que surgirá una integral común. Esta integral tiene una forma cerrada, aunque no es muy bonita.
Región 1 : .0≤d<b
P(D≤d)=∫d0∫d2−y2√0fb(y)fa(x)dxdy=∫d0fb(y)∫d2−y2√0fa(x)dxdy.
Ahora, la integral interna produce . Entonces, nos queda calcular una integral de la forma
donde en este caso de interés . La antiderivada del integrando es
1a2d2−y2−−−−−−√(2a−d2−y2−−−−−−√)
G(c)−G(0)=∫c0(b−y)d2−y2−−−−−−√(2a−d2−y2−−−−−−√)dy,
c=dG(y)=∫(b−y)d2−y2−−−−−−√(2a−d2−y2−−−−−−√)dy=a3d2−y2−−−−−−√(y(3b−2y)+2d2)+abd2tan−1(yd2−y2√)−bd2y+by33+(dy)22−y44.
De esto obtenemos que .P(D≤d)=2a2b2(G(d)−G(0))
Región 2 : .b≤d≤a
P(D≤d)=2a2b2(G(b)−G(0)),
por el mismo razonamiento que para la Región 1, excepto que ahora debemos integrar a lo largo del eje hasta lugar de solo .
ybd
Región 3 : .
a<d≤a2+b2−−−−−−√
P(D≤d)=∫d2−a2√0fb(y)dy+∫bd2−a2√fb(y)∫d2−y2√0fa(x)dxdy=Fb(d2−a2−−−−−−√)+2a2b2(G(b)−G(d2−a2−−−−−−√))
A continuación se muestra una simulación de 20000 puntos donde graficamos la distribución empírica como puntos grises y la distribución teórica como una línea, coloreada de acuerdo con la región particular que se aplica.
A partir de la misma simulación, a continuación trazamos los primeros 100 pares de puntos y dibujamos líneas entre ellos. Cada uno está coloreado de acuerdo con la distancia entre el par de puntos y en qué región cae esta distancia.
El número esperado de pares de puntos dentro de la distancia es simplemente
por linealidad de expectativa.d
E[ξ]=(n2)P(D≤d),
probability
.