El problema se refiere a la construcción de árboles de decisión. Según Wikipedia, el ' coeficiente de Gini ' no debe confundirse con la ' impureza de Gini '. Sin embargo, ambas medidas se pueden usar al construir un árbol de decisión; estas pueden respaldar nuestras elecciones al dividir el conjunto de elementos.
1) 'impureza de Gini': es una métrica estándar de división de árboles de decisión (ver en el enlace anterior);
2) 'Coeficiente de Gini': cada división se puede evaluar en función del criterio AUC. Para cada escenario de división, podemos construir una curva ROC y calcular la métrica AUC. Según Wikipedia AUC = (GiniCoeff + 1) / 2;
La pregunta es: ¿son equivalentes ambas medidas? Por un lado, me informan que el coeficiente de Gini no debe confundirse con la impureza de Gini. Por otro lado, ambas medidas se pueden utilizar para hacer lo mismo: evaluar la calidad de una división del árbol de decisión.