AIC y la regresión de cresta pueden hacerse compatibles cuando se hacen ciertas suposiciones. Sin embargo, no existe un método único para elegir una contracción para la regresión de crestas, por lo tanto, no existe un método general para aplicar AIC. La regresión de cresta es un subconjunto de la regularización de Tikhonov . Hay muchos criterios que se pueden aplicar para seleccionar los factores de suavizado para la regularización de Tikhonov, por ejemplo, vea esto . Para usar AIC en ese contexto, hay un documento que hace suposiciones bastante específicas sobre cómo realizar esa regularización, selección de parámetros de regularización basada en la complejidad de la información para la solución de problemas inversos mal condicionados . En concreto, esto supone
"En un marco estadístico, ... eligiendo el valor del parámetro de regularización α , y utilizando el método de máxima probabilidad penalizada (MPL) ... Si consideramos el ruido gaussiano no correlacionado con varianza y usamos la penalización una norma complicada, vea el enlace de arriba , la solución MPL es la misma que la solución regularizada de Tikhonov (1963) ".σ2p ( x ) =
La pregunta entonces es, ¿deberían hacerse esas suposiciones? La cuestión de los grados de libertad necesarios es secundaria a la cuestión de si AIC y la regresión de cresta se utilizan o no en un contexto coherente. Sugeriría leer el enlace para más detalles. No estoy evitando la pregunta, es solo que uno puede usar muchas cosas como objetivos de cresta, por ejemplo, uno podría usar el factor de suavizado que optimiza el AIC . Entonces, una buena pregunta merece otra, "¿Por qué molestarse con AIC en un contexto de cresta?" En algunos contextos de regresión de crestas, es difícil ver cómo AIC podría hacerse relevante. Por ejemplo, se aplicó la regresión de cresta para minimizar la propagación de error relativo de , es decir, minsi[ DE ( b )si] de la distribución gamma (GD) dada por
GD ( t ; a , b ) =1tmi- bt( bt )unΓ ( a );t ≥ 0,
[ 0 , ∞ )[ t1, tnorte]muestras de tiempo. Para ser claros, eso se hace porque el AUC es una integral mal planteada y, de lo contrario, por ejemplo, usando ML, el ajuste de distribución gamma carecería de robustez. Por lo tanto, para esa aplicación en particular, la máxima probabilidad, por lo tanto, AIC, es realmente irrelevante. (Se dice que AIC se usa para la predicción y BIC para la bondad de ajuste. Sin embargo, la predicción y la bondad de ajuste están relacionadas de manera indirecta con una medida sólida de AUC).
dfλdf=pλ=0df=0λ=∞dfdf∞df
dfridge=∑(λi/(λi+λλiXTXdf