¿Cuál de las siguientes opciones de conjunto de pasos es la correcta al crear un modelo predictivo?
Opción 1:
Primero elimine los predictores más evidentemente malos, y preprocese el resto si es necesario, luego entrene varios modelos con validación cruzada, elija los mejores, identifique los mejores predictores que cada uno ha utilizado, luego vuelva a entrenar esos modelos solo con esos predictores y evalúe la precisión nuevamente con validación cruzada, luego elija el mejor y capacítelo en el conjunto de entrenamiento completo usando sus predictores clave y luego úselo para predecir el conjunto de prueba.
Opcion 2:
Primero elimine los predictores más evidentemente malos, luego preprocese el resto si es necesario, luego use una técnica de selección de características como la selección de características recursivas (por ejemplo, RFE con rf) con validación cruzada, por ejemplo, para identificar el número ideal de predictores clave y cuáles son estos predictores son, luego entrenar diferentes tipos de modelos con validación cruzada y ver cuál da la mejor precisión con los principales predictores identificados anteriormente. Luego entrene el mejor de esos modelos nuevamente con esos predictores en el conjunto de entrenamiento completo y luego úselo para predecir el conjunto de prueba.