Preguntas etiquetadas con random-forest

El bosque aleatorio es un método de aprendizaje automático basado en la combinación de los resultados de muchos árboles de decisión.




1
Bosque aleatorio vs Adaboost
En la sección 7 del documento Random Forests (Breiman, 1999), el autor declara la siguiente conjetura: "Adaboost es un bosque aleatorio". ¿Alguien ha probado o refutado esto? ¿Qué se ha hecho para probar o refutar esta publicación de 1999?




2
Variedad de cuidados para el modelo randomForest
Tengo problemas para entender cómo varImpfunciona la función para un modelo randomForest con el caretpaquete. En el ejemplo a continuación, la característica var3 tiene cero importancia usando la varImpfunción de caret , pero el modelo final randomForest subyacente tiene una importancia distinta de cero para la característica var3. ¿Por qué …
10 r  caret  random-forest 

1
¿Cómo incorporo un valor atípico innovador en la observación 48 en mi modelo ARIMA?
Estoy trabajando en un conjunto de datos. Después de usar algunas técnicas de identificación de modelos, obtuve un modelo ARIMA (0,2,1). Utilicé la detectIOfunción en el paquete TSAen R para detectar un valor atípico innovador (IO) en la observación número 48 de mi conjunto de datos original. ¿Cómo incorporo este …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


1
error de randomForest y de importancia variable?
No obtengo la diferencia entre rfobject$importancey importance(rfobject)en la columna MeanDecreaseAccuracy. Ejemplo: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648 Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105 Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869 Petal.Width 0.349686983 0.318527008 0.270975757 0.31054451 46.323415 …

4
¿Hay alguna manera de usar la validación cruzada para hacer la selección de variables / características en R?
Tengo un conjunto de datos con aproximadamente 70 variables que me gustaría reducir. Lo que estoy buscando hacer es usar CV para encontrar las variables más útiles de la siguiente manera. 1) Seleccione aleatoriamente digamos 20 variables. 2) Use stepwise/ LASSO/ lars/ etc para elegir las variables más importantes. 3) …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.