Preguntas etiquetadas con random-forest

El bosque aleatorio es un método de aprendizaje automático basado en la combinación de los resultados de muchos árboles de decisión.

2
Medidas de importancia variable en bosques aleatorios.
He estado jugando con bosques aleatorios para la regresión y tengo dificultades para determinar exactamente qué significan las dos medidas de importancia y cómo deben interpretarse. La importance()función proporciona dos valores para cada variable: %IncMSEy IncNodePurity. ¿Hay interpretaciones simples para estos 2 valores? En IncNodePurityparticular, ¿es esto simplemente la cantidad …

1
calculado manualmente
Sé que esto es bastante específico Rpregunta, pero puede estar pensando en proporción de varianza explicado, R2R2R^2 , de forma incorrecta. Aquí va. Estoy tratando de usar el Rpaquete randomForest. Tengo algunos datos de entrenamiento y datos de prueba. Cuando ajusto un modelo de bosque aleatorio, la randomForestfunción le permite …

6
Mejora la clasificación con muchas variables categóricas
Estoy trabajando en un conjunto de datos con más de 200,000 muestras y aproximadamente 50 características por muestra: 10 variables continuas y las otras ~ 40 son variables categóricas (países, idiomas, campos científicos, etc.). Para estas variables categóricas, tiene por ejemplo 150 países diferentes, 50 idiomas, 50 campos científicos, etc. …



3
Cómo interpretar la disminución media de precisión y la disminución media de GINI en modelos de bosque aleatorio
Tengo algunas dificultades para comprender cómo interpretar la salida de importancia variable del paquete Random Forest. La disminución media en la precisión generalmente se describe como "la disminución en la precisión del modelo al permutar los valores en cada característica". ¿Es esta una declaración sobre la característica en su conjunto …


2
¿Las variables altamente correlacionadas en el bosque aleatorio distorsionan la precisión y la selección de características?
En mi opinión, las variables altamente correlacionadas no causarán problemas de multicolinealidad en el modelo de bosque aleatorio (corríjame si me equivoco). Sin embargo, por otro lado, si tengo demasiadas variables que contienen información similar, ¿el modelo pesará demasiado en este conjunto en lugar de los demás? Por ejemplo, hay …

2
Importancia relativa de un conjunto de predictores en una clasificación aleatoria de bosques en R
Me gustaría determinar la importancia relativa de los conjuntos de variables para un randomForestmodelo de clasificación en R. La importancefunción proporciona la MeanDecreaseGinimétrica para cada predictor individual: ¿es tan simple como sumar esto en cada predictor de un conjunto? Por ejemplo: # Assumes df has variables a1, a2, b1, b2, …



3




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.