Me doy cuenta de que hay 3 parámetros de ajuste en el modelo de árboles de refuerzo, es decir
- El número de árboles (número de iteraciones)
- parámetro de contracción
- Número de divisiones (tamaño de cada árbol constituyente)
Mi pregunta es: para cada uno de los parámetros de ajuste, ¿cómo debo encontrar su valor óptimo? Y que metodo?
Tenga en cuenta que: el parámetro de contracción y el parámetro de número de árboles operan juntos, es decir, un valor menor para el parámetro de contracción conduce a un valor más alto para el número de árboles. Y también debemos tener esto en cuenta.
Estoy particularmente interesado en el método para encontrar el valor óptimo para el número de divisiones. ¿Debería basarse en la validación cruzada o el conocimiento del dominio sobre el modelo detrás?
¿Y cómo se llevan a cabo estas cosas en el gbm
paquete en R?