Debido a que ( como es bien sabido ) se obtiene una distribución uniforme en la esfera de la unidad normalizando una distribución normal de variación y el producto de punto de los vectores normalizados es su coeficiente de correlación, las respuestas a los tres las preguntas son:SD−1Dt
u=(t+1)/2 tiene una distribución Beta .((D−1)/2,(D−1)/2)
La varianza de es igual a (como se especula en la pregunta).t1/D
La distribución estandarizada de aproxima a la normalidad a una tasa detO(1D).
Método
La distribución exacta del producto escalar de los vectores unitarios se obtiene fácilmente geométricamente, porque este es el componente del segundo vector en la dirección del primero. Dado que el segundo vector es independiente del primero y se distribuye uniformemente en la esfera de la unidad, su componente en la primera dirección se distribuye de la misma manera que cualquier coordenada de la esfera. (Tenga en cuenta que la distribución del primer vector no importa).
Encontrar la densidad
Dejando que esa coordenada sea la última, la densidad en es, por lo tanto, proporcional al área de superficie que se encuentra a una altura entre y en la esfera de la unidad. Esa proporción ocurre dentro de un cinturón de altura y radio que es esencialmente un tronco cónico construido a partir de un de radio de altura y pendiente . De donde la probabilidad es proporcional at∈[−1,1]tt+dtdt1−t2−−−−−√,SD−21−t2−−−−−√,dt1/1−t2−−−−−√
(1−t2−−−−−√)D−21−t2−−−−−√dt=(1−t2)(D−3)/2dt.
Dejar implica . Sustituyendo eso en el precedente da el elemento de probabilidad hasta una constante de normalización:u=(t+1)/2∈[0,1]t=2u−1
fD(u)du∝(1−(2u−1)2)(D−3)/2d(2u−1)=2D−2(u−u2)(D−3)/2du.
Es inmediato que tiene una distribución Beta , porque (por definición) su densidad también es proporcional au=(t+1)/2((D−1)/2,(D−1)/2)
u(D−1)/2−1(1−u)(D−1)/2−1=(u−u2)(D−3)/2∝fD(u).
Determinando el comportamiento limitante
La información sobre el comportamiento limitante se deduce fácilmente de esto mediante técnicas elementales: se puede integrar para obtener la constante de proporcionalidad ; puede integrarse (usando las propiedades de las funciones Beta, por ejemplo) para obtener momentos, mostrando que la varianza es y se reduce a (de donde, por el Teorema de Chebyshev, la probabilidad se concentra cerca de ); y la distribución limitante se encuentra luego considerando los valores de la densidad de la distribución estandarizada, proporcional a para valores pequeños defDΓ(n2)π√Γ(D−12)tkfD(t)1/D0t=0fD(t/D−−√),t :
log(fD(t/D−−√))=C(D)+D−32log(1−t2D)=C(D)−(1/2+32D)t2+O(t4D)→C−12t2
donde las representan constantes (log) de integración. Evidentemente, la velocidad a la que esto se aproxima a la normalidad (para la cual la densidad logarítmica es igual a ) esC−12t2O(1D).
Este gráfico muestra las densidades del producto escalar para , según la varianza estandarizada, y su densidad limitante. Los valores en aumentan con (de azul a rojo, dorado y luego verde para la densidad normal estándar). La densidad para sería indistinguible de la densidad normal en esta resolución.D=4,6,100DD=1000