¿Cómo se informa la matriz de confusión de la validación cruzada K-fold?


18

Supongamos que hago validación cruzada K-fold con K = 10 pliegues. Habrá una matriz de confusión para cada pliegue. Al informar los resultados, ¿debo calcular cuál es la matriz de confusión promedio o simplemente sumar las matrices de confusión?

Respuestas:


11

Si está probando el rendimiento de un modelo (es decir, no optimizando parámetros), generalmente sumará las matrices de confusión. Piénselo de esta manera, ha dividido sus datos en 10 pliegues diferentes o conjuntos de 'prueba'. Entrena su modelo en 9/10 de los pliegues y prueba el primer pliegue y obtiene una matriz de confusión. Esta matriz de confusión representa la clasificación de 1/10 de los datos. Repite el análisis nuevamente con el siguiente conjunto de 'prueba' y obtiene otra matriz de confusión que representa otro 1/10 de los datos. Agregar esta nueva matriz de confusión a la primera ahora representa el 20% de sus datos. Continúa hasta que haya ejecutado todos sus pliegues, sume todas sus matrices de confusión y la matriz de confusión final represente el rendimiento de ese modelo para todos los datos.. Podría promediar las matrices de confusión, pero eso realmente no proporciona ninguna información adicional de la matriz acumulativa y puede estar sesgado si sus pliegues no son todos del mismo tamaño.

Nota : esto supone un muestreo no repetido de sus datos. No estoy completamente seguro de si esto sería diferente para el muestreo repetido. Se actualizará si aprendo algo o alguien me recomienda un método.


Gracias cdeterman. ¿Qué pasa con la selección del modelo (es decir, optimizar los parámetros de ajuste)?
John M

@JohnM, entonces está mirando cada pliegue de forma independiente para obtener una indicación de cuáles deberían ser los mejores parámetros para el modelo completo. Es posible que desee ver un cv anidado si desea combinar ambos.
cdeterman
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.