Tengo datos con unos pocos miles de funciones y quiero hacer una selección de funciones recursivas (RFE) para eliminar las que no son informativas. Hago esto con caret y RFE. Sin embargo, comencé a pensar, si quiero obtener el mejor ajuste de regresión (bosque aleatorio, por ejemplo), ¿cuándo debo realizar el ajuste de parámetros ( mtrypara RF)? Es decir, según entiendo, caret entrena RF repetidamente en diferentes subconjuntos de características con una frecuencia fija. Supongo que el valor óptimo se mtrydebe encontrar una vez finalizada la selección de características, pero ¿influirá el mtryvalor que utiliza caret en el subconjunto de características seleccionado? Usar caret con low mtryes mucho más rápido, por supuesto.
Espero que alguien pueda explicarme esto.