Los grados de libertad no son enteros en varios contextos. De hecho, en algunas circunstancias, puede establecer que los grados de libertad para ajustar los datos para algunos modelos particulares deben estar entre algún valor k y k + 1 .
Generalmente pensamos en los grados de libertad como el número de parámetros libres, pero hay situaciones en las que los parámetros no son completamente libres y pueden ser difíciles de contar. Esto puede suceder al suavizar / regularizar, por ejemplo.
Los casos de regresión ponderada localmente / métodos de kernel y splines suavizados son ejemplos de tal situación: un número total de parámetros libres no es algo que pueda contar fácilmente sumando predictores, por lo que se necesita una idea más general de los grados de libertad.
gam
y^= A ytr( A )tr( A AT)tr( 2 A - A AT)tr( A )XUNA
tr( A )
∑yo∂y^yo∂yyotr( A )y^∂y^yo∂yyo
Para modelos como los instalados gam
, esas diversas medidas generalmente no son enteras.
(Recomiendo encarecidamente leer la discusión de estas referencias sobre este tema, aunque la historia puede volverse bastante más complicada en algunas situaciones. Ver, por ejemplo, [4])
[1] Hastie, T. y Tibshirani, R. (1990),
Generalized Additive Models
London: Chapman and Hall.
[2] Hastie, T., Tibshirani, R. y Friedman, J. (2009),
The Elements of Statistical Learning: Data Mining, Inference, and Prediction , 2ndEd
Springer-Verlag.
https://statweb.stanford.edu/~tibs/ElemStatLearn/
[3] Ye, J. (1998),
"Sobre la medición y corrección de los efectos de la minería de datos y la selección de modelos",
Journal of the American Statistical Association , vol. 93, núm. 441, págs. 120-131
[4] Janson, L., Fithian, W. y Hastie, T. (2013),
"Grados efectivos de libertad: una metáfora defectuosa"
https://arxiv.org/abs/1312.7851