Para la tarea de modelado de abandono que estaba considerando:
- Calcule k grupos para los datos
- Construya k modelos para cada grupo individualmente.
La razón de esto es que no hay nada que demostrar, que la población de subsistemas es homogénea, por lo que es razonable suponer que el proceso de generación de datos puede ser diferente para diferentes "grupos".
Mi pregunta es, ¿es un método apropiado? ¿Viola algo o se considera malo por alguna razón? Si es así, ¿por qué?
Si no, ¿compartiría algunas de las mejores prácticas sobre ese tema? Y lo segundo: ¿es generalmente mejor o peor hacer preclustering que el árbol modelo? idk si tiene alguna ventaja sobre la agrupación "normal".