Tengo dificultades para seleccionar la forma correcta de visualizar datos. Digamos que tenemos librerías que venden libros , y cada libro tiene al menos una categoría .
Para una librería, si contamos todas las categorías de libros, adquirimos un histograma que muestra la cantidad de libros que cae en una categoría específica para esa librería.
Quiero visualizar el comportamiento de la librería, quiero ver si favorecen una categoría sobre otras categorías. No quiero ver si están favoreciendo la ciencia ficción todos juntos, pero quiero ver si están tratando a cada categoría por igual o no.
Tengo ~ 1M librerías.
He pensado en 4 métodos:
Muestree los datos, muestre solo 500 histogramas de la librería. Muéstrelos en 5 páginas separadas usando una cuadrícula de 10x10. Ejemplo de una cuadrícula 4x4:
Igual que el n. ° 1. Pero esta vez clasifique los valores del eje x de acuerdo con su recuento descifrado, por lo que si hay un favor, se verá fácilmente.
Imagina poner los histogramas en el n. ° 2 juntos como un mazo y mostrarlos en 3D. Algo como esto:
En lugar de usar el color de demanda del tercer eje para representar los colores, utilice un mapa de calor (histograma 2D):
si las librerías generalmente prefieren algunas categorías a otras, se mostrará como un bonito degradado de izquierda a derecha.
¿Tiene alguna otra idea / herramienta de visualización para representar varios histogramas?