Aquí hay una pregunta relacionada ¿ cuándo-es-apropiado-seleccionar-modelos-minimizando-el-aic? . Le da una idea general de lo que las personas no irreconocibles en el mundo académico consideran apropiado escribir y qué referencias dejar como importantes.
En general, lo que importa son las diferencias entre las probabilidades o las AIC, no sus valores absolutos. Te has perdido la palabra importante "diferencia" en tu "BIC: 0-2 es débil" en la pregunta - revisa la TABLA 6 de Raftery - y es extraño que nadie quiera corregir eso.
Yo mismo me enseñaron a buscar MAICE (Estimación mínima de AIC, como Akaike lo llamó). ¿Y qué? Esto es lo que una persona famosa le escribió a una mujer desconocida:
Dear Miss --
I have read about sixteen pages of your manuscript ... I suffered exactly the same
treatment at the hands of my teachers who disliked me for my independence and passed
over me when they wanted assistants ... keep your manuscript for your sons and
daughters, in order that they may derive consolation from it and not give a damn for
what their teachers tell them or think of them. ... There is too much education
altogether.
Mis maestros nunca escucharon sobre documentos con títulos como "Una prueba de si dos AIC difieren significativamente" y ni siquiera recuerdo que alguna vez llamaron a AIC una estadística, que tendría una distribución de muestreo y otras propiedades. Me enseñaron que AIC es un criterio para minimizar, si es posible de forma automática.
Otra cuestión importante, que creo que IrishStat expresó hace unos años aquí (de memoria, así que disculpa si me equivoco al no encontrar esa respuesta) es que AIC, BIC y otros criterios se han derivado para diferentes propósitos y bajo diferentes condiciones (supuestos), por lo que a menudo no puede usarlos indistintamente si su propósito es pronosticar, por ejemplo. No puedes simplemente preferir algo inapropiado.
Mis fuentes muestran que usé una cita de Burnham y Anderson (2002, p.70) para escribir que el delta (diferencias de AIC) dentro de 0-2 tiene un apoyo sustancial; delta dentro de 4-7 considerablemente menos soporte y delta mayor de 10 esencialmente sin soporte. Además, escribí que "los autores también discutieron las condiciones bajo las cuales estas pautas pueden ser útiles". El libro se cita en la respuesta de Stat, que voté como el más relevante.