Está bien establecido, al menos entre los estadísticos de algún calibre más alto, que los modelos con los valores del estadístico AIC dentro de un cierto umbral del valor mínimo deben considerarse apropiados como el modelo que minimiza el estadístico AIC. Por ejemplo, en [1, p.221] encontramos
Entonces, los modelos con GCV o AIC pequeños se considerarían los mejores. Por supuesto, uno no solo debe minimizar a ciegas el GCV o el AIC. Más bien, todos los modelos con valores de GCV o AIC razonablemente pequeños deben considerarse como potencialmente apropiados y evaluados de acuerdo con su simplicidad y relevancia científica.
Del mismo modo, en [2, p.144] tenemos
Se ha sugerido (Duong, 1984) que los modelos con valores de AIC dentro de c del valor mínimo deben considerarse competitivos (con c = 2 como valor típico). La selección entre los modelos competitivos puede basarse en factores tales como la blancura de los residuos (Sección 5.3) y la simplicidad del modelo.
Referencias
- Ruppert, D .; Varita, MP y Carrol, Regresión Semiparamétrica RJ , Cambridge University Press, 2003
- Brockwell, PJ & Davis, RA Introducción a series de tiempo y pronósticos , John Wiley & Sons, 1996
Entonces, dado lo anterior, ¿cuál de los dos modelos a continuación debería preferirse?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
En términos más generales, ¿cuándo es apropiado seleccionar modelos minimizando ciegamente el AIC o la estadística relacionada?