Preguntas etiquetadas con random-forest

El bosque aleatorio es un método de aprendizaje automático basado en la combinación de los resultados de muchos árboles de decisión.



1
En un bosque aleatorio, ¿el% IncMSE mayor es mejor o peor?
Una vez que he construido un modelo de bosque aleatorio (regresión) en R, la llamada rf$importanceme proporciona dos medidas para cada variable predictiva, %IncMSEy IncNodePurity. ¿La interpretación de que las variables predictoras con %IncMSEvalores más pequeños es más importante que las variables predictoras con %IncMSEvalores más grandes ? ¿Qué tal …




2
Selección de características con bosques aleatorios
Tengo un conjunto de datos con variables financieras en su mayoría (120 características, ejemplos de 4k) que en su mayoría están altamente correlacionadas y son muy ruidosas (indicadores técnicos, por ejemplo), por lo que me gustaría seleccionar un máximo de 20-30 para su uso posterior con entrenamiento modelo (clasificación binaria …



1
Paquete R para bosque aleatorio ponderado? opción classwt?
Estoy tratando de usar Random Forest para predecir el resultado de un conjunto de datos extremadamente desequilibrado (la tasa de clase minoritaria es de solo 1% o incluso menos). Debido a que el algoritmo tradicional de bosque aleatorio minimiza la tasa de error general, en lugar de prestar especial atención …
16 r  random-forest 



1
¿El bosque aleatorio de Breiman utiliza la ganancia de información o el índice de Gini?
Me gustaría saber si el bosque aleatorio de Breiman (bosque aleatorio en el paquete R randomForest) usa como criterio de división (criterio para la selección de atributos) la ganancia de información o el índice de Gini. Traté de encontrarlo en http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm y en la documentación del paquete randomForest en R. …


7
El bosque aleatorio está sobreajustado
Estoy tratando de usar Regresión forestal aleatoria en scikits-learn. El problema es que recibo un error de prueba muy alto: train MSE, 4.64, test MSE: 252.25. Así es como se ven mis datos: (azul: datos reales, verde: predicho): Estoy usando 90% para entrenamiento y 10% para prueba. Este es el …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.