La selección de funciones puede considerarse una etapa a evitar. Debe pasar tiempo de cómputo para eliminar características y, de hecho, perder datos, y los métodos que tiene que hacer para seleccionar las características no son óptimos, ya que el problema es NP-Complete . Usarlo no suena como una oferta que no puedes rechazar.
Entonces, ¿cuáles son los beneficios de usarlo?
- Muchas características y una baja proporción de muestras / características introducirán ruido en su conjunto de datos. En tal caso, es probable que su algoritmo de clasificación se sobreajuste y le dé una falsa sensación de buen rendimiento.
- Reducir la cantidad de funciones reducirá el tiempo de ejecución en las etapas posteriores. Eso a su vez le permitirá usar algoritmos de mayor complejidad, buscar más hiperparámetros o hacer más evaluaciones.
- Un conjunto más pequeño de características es más comprensible para los humanos. Eso le permitirá centrarse en las principales fuentes de previsibilidad y realizar una ingeniería de características más exacta. Si tendrá que explicar su modelo a un cliente, es mejor presentar un modelo con 5 características que un modelo con 200 características.
Ahora para su caso específico: le recomiendo que comience a calcular las correlaciones entre las características y el concepto. Calcular correlaciones entre todas las características también es informativo. Tenga en cuenta que hay muchos tipos de correlaciones útiles (p. Ej., Pearson , información mutua ) y muchos atributos que podrían afectarlos (p. Ej., Escasez, desequilibrio de conceptos). Examinarlos en lugar de ir ciegamente con un algoritmo de selección de características podría ahorrarle mucho tiempo en el futuro.
No creo que tenga muchos problemas de tiempo de ejecución con su conjunto de datos. Sin embargo, su proporción de muestras / características no es demasiado alta, por lo que podría beneficiarse de la selección de características.
Elija un clasificador de baja complejidad (p. Ej., Regresión lineal, un pequeño árbol de decisión) y utilícelo como punto de referencia. Pruébelo en el conjunto de datos completo y en algunos conjuntos de datos con un subconjunto de las características. Tal punto de referencia lo guiará en el uso de la selección de funciones. Necesitará dicha orientación ya que hay muchas opciones (por ejemplo, la cantidad de características para seleccionar, el algoritmo de selección de características) y dado que el objetivo suele ser la predicción y no la selección de características, por lo que la retroalimentación está al menos a un paso de distancia.