En mi clase de aprendizaje automático, aprendimos cómo la regresión LASSO es muy buena para realizar la selección de funciones, ya que utiliza la regularización .
Mi pregunta: ¿las personas normalmente usan el modelo LASSO solo para hacer la selección de funciones (y luego proceden a volcar esas funciones en un modelo de aprendizaje automático diferente), o suelen usar LASSO para realizar tanto la selección de funciones como la regresión real?
Por ejemplo, suponga que desea hacer una regresión de cresta, pero cree que muchas de sus características no son muy buenas. ¿Sería prudente ejecutar LASSO, tomar solo las características que no están casi cerradas por el algoritmo y luego usar solo aquellas para volcar sus datos en un modelo de regresión de crestas? De esta manera, obtiene el beneficio de la regularización para realizar la selección de funciones, pero también el beneficio de la regularización para reducir el sobreajuste. (Sé que esto básicamente equivale a Regresión neta elástica, pero parece que no necesita tener los términos y en la función objetivo de regresión final).
Además de la regresión, ¿es esta una estrategia inteligente al realizar tareas de clasificación (utilizando SVM, redes neuronales, bosques aleatorios, etc.)?