Me encontré con algunos estadísticos que nunca usan modelos que no sean Regresión lineal para la predicción porque creen que los "modelos ML", como el bosque aleatorio o el aumento de gradiente, son difíciles de explicar o "no interpretables".
En una regresión lineal, dado que se verifica el conjunto de supuestos (normalidad de errores, homoscedasticidad, no multicolinealidad), las pruebas t proporcionan una forma de probar la importancia de las variables, pruebas que hasta donde sé no están disponibles en el bosques aleatorios o modelos de aumento de gradiente.
Por lo tanto, mi pregunta es si quiero modelar una variable dependiente con un conjunto de variables independientes, en aras de la interpretabilidad, ¿debería usar siempre la regresión lineal?