Se sabe que al construir un árbol de decisión, dividimos la variable de entrada exhaustivamente y encontramos la "mejor" división por enfoque de prueba estadística o enfoque de función de impureza.
Mi pregunta es cuando usamos una variable continua como la variable de entrada (solo unos pocos valores duplicados), el número de divisiones posibles podría ser muy grande, para encontrar la 'mejor' división llevará mucho tiempo. ¿Cómo trataría el científico de datos?
He leído algunos materiales que la gente haría una agrupación de niveles de la entrada para limitar las posibles divisiones. ( ejemplo ) Sin embargo, no explican cómo se hace. ¿En qué nos basamos para agrupar una variable univariante? ¿Hay algún recurso para obtener más detalles o alguien puede explicarlo en detalle?
¡Gracias!