Al seleccionar un número apropiado de nudos para un GAM, uno puede tener en cuenta el número de datos e incrementos en el eje x.
¿Qué pasa si tenemos 100 incrementos en el eje x con 1000 puntos de datos en cada incremento?
La información aquí dice:
Si no se suministran, los nudos de la spline se colocan de manera uniforme a lo largo de los valores covariables a los que se refiere el término: por ejemplo, si se ajustan 101 datos con una spline de 11 nudos de x, entonces habría un nudo cada 10 (ordenado) x valor
Entonces, ¿un comienzo básico debería ser de 9 nudos en este ejemplo? No estoy seguro de qué rango de nudos sería adecuado para este conjunto de datos, ya que es posible ajustar números muy pequeños a muy grandes.
set.seed(1)
dat <- data.frame(y = rnorm(10000), x = 100)
library(ggplot)
ggplot(dat, aes(x = x, y = y)) +
geom_point(size= 0.5) +
stat_smooth(method = "gam",
formula = y ~ s(x, bs = "cs"),k=9, col = "black")
Si k = 25 proporcionó un ajuste útil, ¿sería razonable para estos datos?
bs = "cs"
término en la spline?