La distribución normal bivariada con media y matriz de covarianza puede reescribirse en coordenadas polares con radio y ángulo . Mi pregunta es: ¿Cuál es la distribución de muestreo de , es decir, de la distancia desde un punto al centro estimado dada la matriz de covarianza de muestra ?r θ r x ˉ x S
Antecedentes: la verdadera distancia desde un punto hasta la media sigue una distribución de Hoyt . Con valores propios de y , su parámetro de forma es , y su parámetro de escala es . Se sabe que la función de distribución acumulativa es la diferencia simétrica entre dos funciones Q de Marcum.λ 1 , λ 2 Σ λ 1 > λ 2 q = 1
La simulación sugiere que conectar las estimaciones y para y en el verdadero cdf funciona para muestras grandes, pero no para muestras pequeñas. El siguiente diagrama muestra los resultados de 200 veces
- simulando 20 vectores normales 2D para cada combinación de ( eje ), (filas) y cuantil (columnas) dados
- para cada muestra, calculando el cuantil dado del radio observado a
- para cada muestra, calcular el cuantil de la Hoyt teórico (normal 2D) cdf, y de la cdf teórico Rayleigh después de conectar las estimaciones de la muestra y .
A medida que acerca a 1 (la distribución se vuelve circular), los cuantiles Hoyt estimados se aproximan a los cuantiles Rayleigh estimados que no se ven afectados por . A medida que crece, la diferencia entre los cuantiles empíricos y los estimados aumenta, especialmente en la cola de la distribución.q ω