Robusto ajuste gaussiano multivariante en R


11

Necesito ajustar una distribución gaussiana generalizada a una nube de puntos de 7 luces que contiene un número bastante significativo de valores atípicos con un alto apalancamiento. ¿Conoces algún buen paquete R para este trabajo?


3
Encontrará enlaces a al menos cuatro paquetes R para identificar valores atípicos multivariados en las respuestas a una pregunta similar en stats.stackexchange.com/questions/213/… . Ese podría ser un buen comienzo.
whuber

Tal vez la pregunta me está eludiendo, pero en lo que respecta a una distribución gaussiana multivariada, ¿por qué no usar la media empírica y la DE como el MLE? Luego puede centrarse en las estadísticas de diagnóstico si hay puntos de influencia / apalancamiento altos.
AdamO

Respuestas:


1

También hay mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Sin embargo, una advertencia: el modelado de mezclas en un espacio de alta dimensión puede hacer que la CPU y la memoria sean bastante intensas si su nube de puntos es grande. Hace aproximadamente cuatro años, estaba haciendo un lote de datos de 11-200 puntos, 50-200K puntos, y tendía a correr a 4-11GB de RAM y me tomaba hasta una semana calcular para cada caso (y tenía 400). Esto es ciertamente posible, pero puede ser un dolor de cabeza si está utilizando un clúster de cómputo compartido o tiene recursos limitados disponibles.


1

Esto suena como un clásico modelo de mezcla gaussiana multivariante. Creo que el paquete BayesM podría funcionar.

Aquí hay algunos paquetes de mezcla gaussiana multivariante

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/paper
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.