Estoy tratando de descubrir cómo controlar los parámetros de suavizado en un modelo mgcv: gam.
Tengo una variable binomial que intento modelar principalmente como una función de las coordenadas xey en una cuadrícula fija, además de algunas otras variables con influencias menores. En el pasado, he construido un modelo de regresión local razonablemente bueno utilizando el paquete locfit y solo los valores (x, y).
Sin embargo, quiero intentar incorporar las otras variables en el modelo, y parecía que los modelos aditivos generalizados (GAM) eran una buena posibilidad. Después de mirar los paquetes gam y mgcv, los cuales tienen una función GAM, opté por el último ya que una serie de comentarios en los hilos de la lista de correo parecen recomendarlo. Una desventaja es que no parece soportar una regresión local más suave como loess o locfit.
Para comenzar, solo quería intentar replicar aproximadamente el modelo locfit, usando solo coordenadas (x, y). Probé con suavidades de producto tanto regulares como tensoras:
my.gam.te <- gam(z ~ te(x, y), family=binomial(logit), data=my.data, scale = -1)
my.gam.s <- gam(z ~ s(x, y), family=binomial(logit), data=my.data, scale = -1)
Sin embargo, trazando las predicciones del modelo, son mucho más suaves en comparación con el modelo locfit. Así que he estado tratando de ajustar el modelo para que no sea demasiado suave. He intentado ajustar los parámetros sp y k, pero no me queda claro cómo afectan el suavizado. En locfit, el parámetro nn controla la duración del vecindario utilizado, con valores más pequeños que permiten menos suavizado y más "meneo", lo que ayuda a capturar algunas áreas en la cuadrícula donde la probabilidad de los resultados binomiales cambia rápidamente. ¿Cómo haría para configurar el modelo gam para permitir que se comporte de manera similar?