He estado ajustando algunos datos de series de tiempo usando un modelo aditivo general de Poisson usando SAS PROC GAM
. En términos generales, he estado haciendo que su procedimiento de validación cruzada generalizado incorporado genere al menos un "punto de partida" decente para mi spline individual, que es una función no lineal del tiempo junto con un único término paramétrico (el que yo Estoy realmente interesado en).
Hasta ahora, ha funcionado bastante bien, con la excepción de uno de mis conjuntos de datos. Hay 132 observaciones en ese conjunto de datos, y GCV sugiere una spline de 128 grados de libertad. Eso parece ... mal. Muy mal. Más importante aún, tampoco es del todo estable. Intenté un segundo enfoque, usando algo como un criterio de "Cambio en la estimación" para dejar de agregar grados de libertad cuando la estimación del término paramétrico deja de cambiar porque ¿por qué continuar agregando control si nada es diferente?
El problema es que la estimación no es en absoluto estable. Intenté los siguientes grados de libertad, y como puede ver, el término paramétrico rebota salvajemente:
DF: Parametric Estimate:
1 -0.76903
2 -0.56308
3 -0.47103
4 -0.43631
5 -0.33108
6 -0.1495
7 0.0743
8 0.33459
9 0.62413
10 0.92161
15 1.88763
20 1.98869
30 2.5223
40-60 had convergence issues
70 7.5497
80 7.22267
90 6.71618
100 5.83808
110 4.61436
128 1.32347
No tengo ninguna intuición sobre lo que debería estar usando en términos de df para este bit de datos en particular. ¿Alguna otra idea sobre cómo elegir un df? ¿Debería mirar el significado de la spline?
Mirando un poco más entre df = 10 y df = 15, parece que df = 12 es lo más cercano que puede llegar a la estimación generada por 128 y aún se encuentra en el rango de "grados razonables de libertad". Junto con el término lineal, la intersección y el término paramétrico único, se siente como un modelo bastante saturado. ¿Es justificable ir con 12?
Como segunda actualización, cambiar el suavizado de spline(t)
a loess(t)
resulta en estimaciones de df mucho más bien comportadas. ¿Debería cambiar a suavizado de loess?