¿Cuáles son los métodos que utilizan los algoritmos de aprendizaje del árbol de decisión para tratar los valores perdidos?
¿Simplemente llenan el espacio usando un valor llamado falta?
Gracias.
¿Cuáles son los métodos que utilizan los algoritmos de aprendizaje del árbol de decisión para tratar los valores perdidos?
¿Simplemente llenan el espacio usando un valor llamado falta?
Gracias.
Respuestas:
Hay varios métodos utilizados por varios árboles de decisión. Simplemente ignorar los valores faltantes (como lo hace ID3 y otros algoritmos antiguos) o tratar los valores faltantes como otra categoría (en el caso de una característica nominal) no es un manejo real de los valores perdidos. Sin embargo, esos enfoques se utilizaron en las primeras etapas del desarrollo del árbol de decisión.
Los enfoques de manejo real de datos faltantes no utilizan el punto de datos con valores faltantes en la evaluación de una división. Sin embargo, cuando se crean y entrenan nodos secundarios, esas instancias se distribuyen de alguna manera.
Conozco los siguientes enfoques para distribuir las instancias de valores faltantes a los nodos secundarios: