¿Es posible controlar el costo de una clasificación errónea en el paquete R randomForest ?
En mi propio trabajo, los falsos negativos (por ejemplo, fallar por error que una persona puede tener una enfermedad) son mucho más costosos que los falsos positivos. El paquete rpart permite al usuario controlar los costos de clasificación errónea al especificar una matriz de pérdida para clasificar las clasificaciones erróneas de manera diferente. ¿Existe algo similar para randomForest
? ¿Debo, por ejemplo, usar la classwt
opción para controlar el criterio de Gini?
classwt
: Sí, he descubierto que, en la práctica, y en línea con otros usuarios, los resultados no son los esperados. (iii)cutoff
: No tengo claro cómo utilizarcutoff
en este caso y agradecería cualquier consejo adicional.