Tengo datos con unos pocos miles de funciones y quiero hacer una selección de funciones recursivas (RFE) para eliminar las que no son informativas. Hago esto con caret y RFE. Sin embargo, comencé a pensar, si quiero obtener el mejor ajuste de regresión (bosque aleatorio, por ejemplo), ¿cuándo debo realizar el ajuste de parámetros ( mtry
para RF)? Es decir, según entiendo, caret entrena RF repetidamente en diferentes subconjuntos de características con una frecuencia fija. Supongo que el valor óptimo se mtry
debe encontrar una vez finalizada la selección de características, pero ¿influirá el mtry
valor que utiliza caret en el subconjunto de características seleccionado? Usar caret con low mtry
es mucho más rápido, por supuesto.
Espero que alguien pueda explicarme esto.