Me gustaría crear un bosque aleatorio usando el siguiente proceso:
- Construya un árbol en muestras aleatorias de los datos y características usando la ganancia de información para determinar divisiones
- Termine un nodo de hoja si excede una profundidad predefinida O cualquier división daría como resultado un recuento de hojas menor que un mínimo predefinido
- En lugar de asignar una etiqueta de clase para cada árbol, asigne la proporción de clases en el nodo hoja
- Dejar de construir árboles después de que se haya construido un número predefinido
Esto contradice el proceso forestal aleatorio tradicional de dos maneras. Primero, utiliza árboles podados que asignan proporciones en lugar de etiquetas de clase. Y dos, el criterio de detención es un número predeterminado de árboles en lugar de una estimación de error fuera de bolsa.
Mi pregunta es esta:
Para el proceso anterior que genera N árboles, ¿puedo ajustar un modelo usando regresión logística con selección LASSO? ¿Alguien tiene experiencia en la instalación de un clasificador de bosque aleatorio y el procesamiento posterior con LASSO logístico?
El marco ISLE menciona el uso de LASSO como un paso posterior al procesamiento para problemas de regresión pero no para problemas de clasificación. Además, no obtengo ningún resultado útil cuando busco en Google "Random forest laso".