Estoy tratando de comprender mejor la estimación de la densidad del kernel.
Usando la definición de Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition
Tomemos como una función rectangular que da si está entre y y contrario, y (tamaño de la ventana) es 1.
Entiendo que la densidad es una convolución de dos funciones, pero no estoy seguro de saber cómo definir estas dos funciones. Uno de ellos debería (probablemente) ser una función de los datos que, para cada punto en R, nos dice cuántos puntos de datos tenemos en esa ubicación (principalmente ). Y la otra función probablemente debería ser alguna modificación de la función del núcleo, combinada con el tamaño de la ventana. Pero no estoy seguro de cómo definirlo.
¿Alguna sugerencia?
A continuación se muestra un código R de ejemplo que (sospecho) replica los ajustes que definí anteriormente (con una mezcla de dos gaussianos ), en los que espero ver una "prueba" de que las funciones que se enredarán son como sospechamos .
# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)