Me gustaría comparar 2 clasificadores diferentes para un problema de clasificación de texto multiclase que utiliza grandes conjuntos de datos de entrenamiento. Dudo si debo usar curvas ROC o curvas de aprendizaje para comparar los 2 clasificadores.
Por un lado, las curvas de aprendizaje son útiles para decidir el tamaño del conjunto de datos de entrenamiento, ya que puede encontrar el tamaño del conjunto de datos en el que el clasificador deja de aprender (y quizás se degrada). Entonces, el mejor clasificador en este caso podría ser el que alcanza la mayor precisión con el tamaño de conjunto de datos más pequeño.
Por otro lado, las curvas ROC le permiten encontrar un punto con el equilibrio correcto entre sensibilidad / especificidad. El mejor clasificador en este caso es el que está más cerca de la parte superior izquierda, con el TPR más alto para cualquier FPR.
¿Debo usar ambos métodos de evaluación? ¿Es posible que un método con una mejor curva de aprendizaje tenga una peor curva ROC y viceversa?