Necesito ajustar una distribución gaussiana generalizada a una nube de puntos de 7 luces que contiene un número bastante significativo de valores atípicos con un alto apalancamiento. ¿Conoces algún buen paquete R para este trabajo?
Necesito ajustar una distribución gaussiana generalizada a una nube de puntos de 7 luces que contiene un número bastante significativo de valores atípicos con un alto apalancamiento. ¿Conoces algún buen paquete R para este trabajo?
Respuestas:
También hay mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Sin embargo, una advertencia: el modelado de mezclas en un espacio de alta dimensión puede hacer que la CPU y la memoria sean bastante intensas si su nube de puntos es grande. Hace aproximadamente cuatro años, estaba haciendo un lote de datos de 11-200 puntos, 50-200K puntos, y tendía a correr a 4-11GB de RAM y me tomaba hasta una semana calcular para cada caso (y tenía 400). Esto es ciertamente posible, pero puede ser un dolor de cabeza si está utilizando un clúster de cómputo compartido o tiene recursos limitados disponibles.
Esto suena como un clásico modelo de mezcla gaussiana multivariante. Creo que el paquete BayesM podría funcionar.
Aquí hay algunos paquetes de mezcla gaussiana multivariante