Si su interés principal son los problemas bidimensionales, diría que la estimación de la densidad del kernel es una buena opción porque tiene buenas propiedades asintóticas (tenga en cuenta que no estoy diciendo que sea la mejor). Ver por ejemplo
Parzen, E. (1962). En la estimación de una función y modo de densidad de probabilidad . Annals of Mathematical Statistics 33: 1065–1076.
de Valpine, P. (2004). Probabilidades de espacio de estado de Monte Carlo por estimación de densidad de núcleo posterior ponderada . Revista de la Asociación Americana de Estadística 99: 523-536.
Para dimensiones superiores (4+), este método es realmente lento debido a la conocida dificultad para estimar la matriz de ancho de banda óptima, ver .
Ahora, el problema con el comando ks
en el paquete KDE
es, como usted mencionó, que evalúa la densidad en una cuadrícula específica que puede ser muy limitante. Este problema se puede resolver si usa el paquete KDE
para estimar la matriz de ancho de banda, usando, por ejemplo Hscv
, implementar el estimador de densidad del núcleo y luego optimizar esta función usando el comando optim
. Esto se muestra a continuación utilizando datos simulados y un núcleo gaussiano en R
.
rm(list=ls())
# Required packages
library(mvtnorm)
library(ks)
# simulated data
set.seed(1)
dat = rmvnorm(1000,c(0,0),diag(2))
# Bandwidth matrix
H.scv=Hlscv(dat)
# [Implementation of the KDE](http://en.wikipedia.org/wiki/Kernel_density_estimation)
H.eig = eigen(H.scv)
H.sqrt = H.eig$vectors %*% diag(sqrt(H.eig$values)) %*% solve(H.eig$vectors)
H = solve(H.sqrt)
dH = det(H.scv)
Gkde = function(par){
return( -log(mean(dmvnorm(t(H%*%t(par-dat)),rep(0,2),diag(2),log=FALSE)/sqrt(dH))))
}
# Optimisation
Max = optim(c(0,0),Gkde)$par
Max
Los estimadores con restricción de forma tienden a ser más rápidos, por ejemplo
Cule, ML, Samworth, RJ y Stewart, MI (2010). Estimación de máxima verosimilitud de una densidad log-cóncava multidimensional . Revista Royal Statistical Society B 72: 545–600.
Pero están demasiado altos para este propósito.
4
Otros métodos que puede considerar usar son: ajustar una mezcla finita multivariada de normales (u otras distribuciones flexibles) o
Abraham, C., Biau, G. y Cadre, B. (2003). Estimación simple del modo de una densidad multivariante . The Canadian Journal of Statistics 31: 23–34.
Espero que esto ayude.