¿Cuál es la mejor manera de clasificar los enfoques que se han desarrollado para tratar el problema de la clase de desequilibrio?
Este artículo los clasifica en:
- Preprocesamiento: incluye métodos de sobremuestreo, submuestreo e híbridos,
- Aprendizaje sensible al costo: incluye métodos directos y metaaprendizaje que este último divide en umbrales y muestreo,
- Técnicas de conjunto: incluye conjuntos sensibles al costo y preprocesamiento de datos junto con el aprendizaje de conjunto.
La segunda clasificación:
- Preprocesamiento de datos: incluye cambio de distribución y ponderación del espacio de datos. El aprendizaje de una clase se considera un cambio de distribución.
- Métodos de aprendizaje especiales
- Postprocesamiento de predicción: incluye método de umbral y postprocesamiento sensible al costo
- Métodos híbridos
El tercer artículo :
- Métodos a nivel de datos
- Métodos a nivel de algoritmo
- Métodos híbridos
La última clasificación también considera el ajuste del producto como un enfoque independiente.
Gracias por adelantado.