Digamos que tengo un modelo de clasificación predictivo basado en un bosque aleatorio (usando el paquete randomForest en R). Me gustaría configurarlo para que los usuarios finales puedan especificar un elemento para generar una predicción y generará una probabilidad de clasificación. Hasta ahora, no hay problema.
Pero sería útil / genial poder generar algo como un gráfico de importancia variable, pero para el elemento específico que se predice, no para el conjunto de entrenamiento. Algo como:
Se predice que el artículo X es un perro (73% probable)
porque:
Piernas = 4
Aliento = mal
pelaje =
comida corta = desagradable
Tú entiendes. ¿Existe una forma estándar, o al menos justificable, de extraer esta información de un bosque aleatorio entrenado? Si es así, ¿alguien tiene un código que haga esto para el paquete randomForest?
m
predictores uno por uno y mirar para ver cómo el bosque predice de manera diferente parece algo costoso. Tiene que haber una mejor manera.