Estoy trabajando en la creación de un sitio web, que muestre los datos del censo para los Polígonos seleccionados por un usuario y me gustaría mostrar gráficamente la distribución de varios parámetros (un gráfico por parámetro).
Los datos generalmente tienen las siguientes propiedades:
- El tamaño de la muestra tiende a ser grande (por ejemplo, alrededor de 10,000 puntos de datos)
- El rango de valores tiende a ser mucho mayor (por ejemplo, la población mínima puede ser inferior a 100 y la máxima puede ser algo así como 500,000)
- q1 generalmente está cerca del mínimo (digamos 200) mientras q2 y q3 estarán dentro de 10,000
- No se parece en nada a una distribución normal
No soy estadístico y, por lo tanto, mi descripción podría no ser exactamente clara.
Me gustaría mostrar esta distribución en un gráfico, que será visto por los ciudadanos (el lego, si lo desea).
Me hubiera gustado usar un histograma, pero no es posible debido a la gran variedad de valores, por lo que hacer bins no es realmente fácil y directo.
Por lo poco que sé sobre estadísticas, un diagrama de caja es lo que a menudo se usa para mostrar este tipo de datos, pero creo que para un laico, descifrar el diagrama de caja no es fácil.
¿Cuáles son mis opciones para mostrar estos datos de una manera fácil de entender?