Probablemente estoy lidiando con un problema que probablemente se haya resuelto cientos de veces antes, pero no estoy seguro de dónde encontrar la respuesta.
Cuando mediante regresión logística, dadas muchas características tratando de predecir un valor categórico binario y , estoy interesado en seleccionar un subconjunto de las características que predice y bien.
¿Existe un procedimiento similar al lazo que se pueda usar? (Solo he visto el lazo utilizado para la regresión lineal).
¿Observar los coeficientes del modelo ajustado es indicativo de la importancia de las diferentes características?
Editar - Aclaraciones después de ver algunas de las respuestas:
Cuando me refiero a la magnitud de los coeficientes ajustados, me refiero a aquellos que están ajustados a características normalizadas (media 0 y varianza 1). De lo contrario, como señaló @probabilityislogic, 1000x parecería menos importante que x.
No me interesa simplemente encontrar el mejor k-subconjunto (como estaba ofreciendo @Davide), sino más bien sopesar la importancia de las diferentes características entre sí. Por ejemplo, una característica podría ser "edad" y la otra característica "edad> 30". Su importancia incremental puede ser pequeña, pero ambas pueden ser importantes.