Asintóticamente, minimizar el AIC es equivalente a minimizar el MSE de validación cruzada de dejar uno fuera para los datos de sección transversal [ 1 ]. Entonces, cuando tenemos AIC, ¿por qué uno usa el método de dividir los datos en conjuntos de capacitación, validación y prueba para medir las propiedades predictivas de los modelos? ¿Cuáles son específicamente los beneficios de esta práctica?
Puedo pensar en una razón: si uno quiere evaluar el desempeño predictivo de los modelos, el análisis fuera de la muestra es útil. Pero aunque el AIC no es una medida de la precisión del pronóstico , generalmente se tiene una buena idea si algún modelo está alcanzando su máximo potencial (para los datos que se proporcionan) en términos de qué tan bien podrá predecir.