He leído otros temas sobre las parcelas de dependencia parcial y la mayoría de ellos tratan sobre cómo los trazas realmente con diferentes paquetes, no cómo puedes interpretarlos con precisión, entonces:
He estado leyendo y creando una buena cantidad de parcelas de dependencia parcial. Sé que miden el efecto marginal de una variable χs en la función ƒS (χS) con el efecto promedio de todas las demás variables (χc) de mi modelo. Los valores y más altos significan que tienen una mayor influencia en la predicción precisa de mi clase. Sin embargo, no estoy satisfecho con esta interpretación cualitativa.
Mi modelo (bosque aleatorio) predice dos clases discretas. "Sí árboles" y "No árboles". TRI es una variable que ha demostrado ser una buena variable para esto.
Lo que comencé a pensar es que el valor Y muestra una probabilidad de clasificación correcta. Ejemplo: y (0.2) muestra que los valores TRI de> ~ 30 tienen una probabilidad del 20% de identificar correctamente una clasificación de Verdadero Positivo.
Donde a la inversa
y (-0.2) muestra que los valores TRI de <~ 15 tienen una probabilidad del 20% de identificar correctamente una clasificación Negativa Verdadera.
Las interpretaciones generales que se hacen en la literatura sonarían así: "Los valores superiores al TRI 30 comienzan a tener una influencia positiva para la clasificación en su modelo" y eso es todo. Suena tan vago e inútil para una trama que potencialmente puede hablar mucho sobre sus datos.
Además, todos mis gráficos tienen un límite de -1 a 1 en el rango para el eje y. He visto otras gráficas que son -10 a 10, etc. ¿Es esta una función de cuántas clases está tratando de predecir?
Me preguntaba si alguien puede hablar sobre este problema. Tal vez muéstrame cómo debería interpretar estas tramas o alguna literatura que pueda ayudarme. Tal vez estoy leyendo demasiado en esto?
He leído muy a fondo los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción, y ha sido un gran punto de partida, pero eso es todo.