[Nota: vea la actualización 1 a continuación.] Creo que la metodología rpart
es mucho más fácil de explicar que party
. Sin embargo, este último es mucho más sofisticado y es probable que ofrezca mejores modelos. La forma en que a veces explico party
es hablar de ello como base para producir modelos locales lineales (o GLM). Acumulo esto señalando que los resultados pararpart
son constantes en todos los elementos que caen en el nodo hoja, es decir, el cuadro / región delimitado por las divisiones. Incluso si puede haber mejoras a través de modelos locales, no obtienes nada más que una predicción constante.
En contraste, party
desarrolla las divisiones para optimizar potencialmente los modelos para las regiones. En realidad, está utilizando un criterio diferente al de la optimización del modelo, pero debe medir su propia capacidad para explicar la diferencia para determinar si puede explicarla bien. Los documentos son bastante accesibles para un investigador, pero pueden ser bastante desafiantes para alguien que no está dispuesto a considerar métodos más simples como bosques aleatorios, impulso, etc. Matemáticamente, creo queparty
es más sofisticado ... Sin embargo, los modelos CART son más fáciles explican, tanto en términos de metodología como de resultados, y estos proporcionan un paso decente para introducir modelos más sofisticados basados en árboles.
En resumen, diría que tiene que hacerlo rpart
por claridad, y puede usarlo party
para precisión / rendimiento, pero no lo presentaría party
sin presentarlo rpart
.
Actualización 1. Basé mi respuesta en mi comprensión de party
como era hace uno o dos años. Ha crecido bastante, pero modificaría mi respuesta para decir que todavía lo recomendaría rpart
por su brevedad y legado, en caso de que "no sea lujoso" sea un criterio importante para su cliente / colaborador. Sin embargo, trataría de migrar para usar más funcionalidades party
después de haberle presentado a alguien rpart
. Es mejor comenzar de a poco, con funciones de pérdida, criterios de división, etc., en un contexto simple, antes de introducir un paquete y una metodología que impliquen conceptos mucho más involucrados.