Actualmente estoy trabajando en la construcción de un modelo predictivo para un resultado binario en un conjunto de datos con ~ 300 variables y 800 observaciones. He leído mucho en este sitio sobre los problemas asociados con la regresión gradual y por qué no usarlo.
He estado leyendo sobre la regresión de LASSO y su capacidad para la selección de características y he tenido éxito en su implementación con el uso del paquete "caret" y "glmnet".
Soy capaz de extraer el coeficiente del modelo con el óptimo lambda
y alpha
de "caret"; Sin embargo, no estoy familiarizado con la forma de interpretar los coeficientes.
- ¿Se interpretan los coeficientes LASSO en el mismo método que la regresión logística?
- ¿Sería apropiado usar las características seleccionadas de LASSO en la regresión logística?
EDITAR
Interpretación de los coeficientes, como en los coeficientes exponenciados de la regresión LASSO como las probabilidades de log para un cambio de 1 unidad en el coeficiente mientras se mantienen constantes todos los demás coeficientes.