Recientemente publiqué un conjunto de datos ( enlace ) con 369 clases. Realicé un par de experimentos con ellos para tener una idea de lo difícil que es la tarea de clasificación. Por lo general, me gusta si hay matrices de confusión para ver el tipo de error que se está cometiendo. Sin embargo, una matriz no es práctica.
¿Hay alguna manera de dar la información importante de las matrices de gran confusión? Por ejemplo, generalmente hay muchos ceros que no son tan interesantes. ¿Es posible ordenar las clases de manera que la mayoría de las entradas distintas de cero estén alrededor de la diagonal para permitir mostrar múltiples matrices que forman parte de la matriz de confusión completa?
Aquí hay un ejemplo para una gran matriz de confusión .
Ejemplos en la naturaleza
La figura 6 de EMNIST se ve bien:
Es fácil ver dónde están muchos casos. Sin embargo, esas son solo clases. Si se usara toda la página en lugar de solo una columna, esto probablemente podría ser 3 veces más, pero todavía sería solo clases. Ni siquiera cerca de 369 clases de HASY o 1000 de ImageNet.
Ver también
Mi pregunta similar sobre CS.stackexchange