Si tengo una muestra de iid normal multivariante y defino (que es una especie de distancia de Mahalanobis [al cuadrado] desde un punto de muestra al vector usando la matriz para ponderar), ¿cuál es la distribución de (distancia de Mahalanobis al muestra media usando la matriz de covarianza de muestra )?
Estoy mirando un artículo que dice que es , pero esto obviamente es incorrecto: la se habría obtenido para utilizando el vector medio de población (desconocido) y matriz de covarianza. Cuando se conectan los análogos de muestra, se debe obtener una distribución Hotelling , o una distribución escalada , o algo así, pero no el . No pude encontrar el resultado exacto ni en Muirhead (2005) , ni en Anderson (2003) , ni en Mardia, Kent y Bibby (1979, 2003) χ 2 p d 2 i ( μ , Σ ) T 2 F ( ⋅ ) χ 2 p. Aparentemente, estos tipos no se molestaron con diagnósticos atípicos, ya que la distribución normal multivariada es perfecta y se obtiene fácilmente cada vez que se recopilan datos multivariados: - /.
Las cosas pueden ser más complicadas que eso. El resultado de la distribución de Hotelling se basa en asumir la independencia entre la parte del vector y la parte de la matriz; tal independencia se mantiene para y , pero ya no es válida para y .