¿Debo usar una escala discreta o continua para colorear un cloroplasto?

8

Estoy haciendo un coro para una próxima carrera local usando D3 . Hay dos candidatos que se postulan para una elección. Para cualquier polígono en mi mapa, si el candidato rojo tiene más votos, el color debe ser rojo. Si el candidato azul tiene más votos, el color debe ser azul. Si el candidato azul está ganando mucho, el color debe ser un azul más profundo. Si el candidato rojo está ganando mucho, el color debe ser un rojo más profundo.

¿Debo usar una escala discreta o continua para esto? Es decir, debería crear una rampa de color de rojo a azul para una saturación o intensidad dada. ¿O debería crear contenedores de modo que si el rojo / azul cae en un cierto rango, al polígono se le asigne uno de los pocos colores? De los tutoriales, parece que la mayoría de las personas hacen contenedores.

— bernie2436
fuente

También busque el tema de cartografía / mapas de colores bivariados , en caso de que desee obtener más ideas sobre la técnica elegida.

— Martin F

Los datos equilibrados (dos categorías, el aumento en uno necesariamente implica una disminución en el otro), pueden concebirse como una sola variable. Dado que en muchas elecciones la gran mayoría de los votos son para dos candidatos (incluso si hay más de dos candidatos en la carrera), un aumento para uno es una disminución para otro. Por lo tanto, esto no necesita ser considerado como un mapa bivariado.

— Lee Hachadoorian

13

Hay beneficios y desventajas en cada forma de hacerlo. Para resumir, recomendaría crear "contenedores". Un par de notas para ayudarlo a elegir y sobre el diseño de coropletas en general:

Un mapeo directo del valor de los datos al color (un mapa 'no clasificado') podría considerarse la forma más precisa de mostrar los datos, sin embargo, los mapas clasificados (mapas con 'contenedores') pueden ser más legibles por varias razones.

Si usa un mapa no clasificado y los datos están sesgados, o hay valores atípicos en el conjunto de datos, los valores atípicos se destacarán claramente, mientras que muchos de los polígonos pueden terminar en un color muy similar. Esto destacaría el hecho de que algunas áreas son radicalmente diferentes que otras (en su caso, si un par de áreas tenían una preferencia significativamente mayor por un candidato sobre el otro que la mayoría de las áreas), pero es más difícil distinguir las relaciones dentro de El resto del área del mapa.

En un mapa clasificado, cada clase debe ser visualmente distinta, por lo que es fácil saber dónde se encuentra un área en los datos, a costa de que se pierdan algunas de las distinciones más finas.

Otro problema es que la percepción de la intensidad del color no es estrictamente lineal. Entonces, si tuviera una rampa de color de blanco a azul, que corresponde a ningún candidato que reciba más votos para el plomo máximo para un candidato, el color que es el 75% del camino entre el blanco y el azul podría no percibirse como el 75% del entre los dos colores y, por lo tanto, el usuario del mapa haría una suposición falsa sobre qué valor de datos representaba.

Los mapas clasificados, por otro lado, pueden tener el color de cada clase cuidadosamente elegido para ser percibido clara y distintivamente. No sé lo suficiente para diseñar un conjunto de colores que haga esto, pero Cynthia Brewer y Mark Harrower sí, y crearon colorbrewer2.org , una gran herramienta (gratuita) para ayudar a los cartógrafos a elegir buenos esquemas de color para sus mapas. Puede elegir entre una variedad de esquemas, elegir el número de clases, y ofrece una vista previa de cómo se vería el esquema en la práctica, y los valores RBG, HEX o CMYK para cada color en el esquema. Muy útil, y simplemente divertido para jugar.

Por estas razones, recomendaría hacer un mapa clasificado. El número recomendado de clases suele ser un número impar de 5-9 más o menos. El uso de un número impar da un valor promedio distinto, y este número de clases generalmente se considera suficiente para dar distinciones útiles en los datos, pero no demasiados para que no se puedan distinguir. Como está utilizando un esquema de color divergente (color claro en el medio, dos colores diferentes en cada extremo), puede salirse con más clases, tal vez 7-9.

Dirígete a Colorbrewer, elige "divergir" por la naturaleza de tus datos, selecciona el esquema de color rojo a azul, elige tu número de clases y ¡listo!

Para gran parte de esto, no hay una regla estricta. El estándar es, "¿el mapa comunica bien los datos?" Jugar con los parámetros hasta obtener algo que "funcione" puede ser algo bueno.

Ahora, una nota sobre hacer coropletas. Mis disculpas si este es un terreno familiar para usted:

Un punto de interés cuando se usa un mapa clasificado es cómo se dividen los datos en clases. ¿Se rompe a intervalos iguales a lo largo del rango? ¿Se asigna un cierto número de puntos de datos a cada clase? ¿Cierto número de desviaciones estándar de la media? ¿Está roto en las interrupciones "naturales" en los datos? El método que use marca la diferencia en cómo se representan los datos. No soy un gran programador, y no estoy seguro de qué método utiliza el script que vincula. Los "descansos naturales" suelen ser una buena opción. Para datos con un punto medio claro como datos de sondeo (el punto medio es una división 50/50), las desviaciones estándar pueden ser útiles.

Al hacer un coropleta, es bueno usar datos estandarizados sobre una unidad de área. Por ejemplo, en lugar de utilizar la población total en un condado, es mejor mapear la población por milla cuadrada en cada condado. La razón es que un área más grande tenderá a tener más personas en ella que una más pequeña, por lo que dividir por el área de cada unidad mapeada proporciona una descripción más precisa de las tendencias. Los datos también se pueden estandarizar como un porcentaje. Por ejemplo, una tasa de pobreza en lugar de un número de personas en la pobreza.

Para sus propósitos, es más revelador mapear el porcentaje de votos emitidos para un candidato que el número bruto de votos emitidos para ese candidato.

De todos modos, espero que algo de esto sea útil, ¡y que tu mapa salga bien!

Para gran parte de esta discusión, recurrí a Cartografía temática y geovisualización de Slocum et al.

— Bakern
fuente

El discreto color per cápita del NYT es bastante terrible en estos días. Se pierden muchos detalles porque sus contenedores de colores son idiotas. Creo que definitivamente es un ejemplo en el que debería usarse una escala de color continua.

— Andy

(los mapas de coronavirus que es)

— Andy

5

Aborda uno de los muchos aspectos de la simbolización : cómo representar los valores cuantitativos a través de una representación de color variable, utilizando una escala discreta o continua de saturación o intensidad de color. Buena pregunta. La respuesta es, como a menudo, depende ...

La cartografía temática tradicional reconoce que los mapas, como modelos simplificados de la realidad, son producto de una gran cantidad de generalización. En aras de la simplicidad, las cantidades se agrupan en clases (contenedores), y ha habido muchas discusiones sobre cuántas clases deberían existir (5 o 7 a menudo se promocionaban). Las ventajas: mucho más simple de construir utilizando métodos fotomecánicos tradicionales y más fácil de transmitir el mensaje. Mira, aquí Red Ken es favorecido, mientras que allá, Blue Peter.

La cartografía temática contemporánea permite mapas de mucho mayor detalle donde las cantidades continuas se pueden representar mediante escalas de color de muy altos rangos. Las ventajas: más objetivas y detalladas. Los lectores de mapas pueden potencialmente recrear los datos de origen con más precisión.

Entonces, ¿cuál es el propósito más profundo de su mapa?

¿Desea ser más objetivo al explorar las variaciones detalladas presentes en los datos? Usa las escalas de color continuas. Este concepto de "mapa como herramienta de investigación" viene con nombres (nuevos) como "visualización de datos" y "mapeo de calor".

¿Quieres contar una historia simple? Use escalas de color discretas. Este es el "mapa como herramienta de comunicación".

Dado que su mapa ya está muy generalizado espacialmente, en regiones de votación, podría sugerir el uso de escalas de color continuas como compromiso: tiene discretización espacial pero continuidad estadística. Solo una idea.

En última instancia, depende de usted. ¿Por qué no experimentar con algunas variaciones?

— Martin F
fuente

Creo que si la historia de la visualización hubiera comenzado con las computadoras modernas en lugar de la impresión barata con un número limitado de colores de tinta, la gente estaría más predispuesta a usar escalas de color continuas.

— Andy

1

Veo dos opciones:

a) solo usa contenedores: (los números son solo un ejemplo)

Candidato Rojo tiene> 50% - 70% de los votos -> color rojo claro
El candidato rojo tiene> 70% de los votos -> el color es rojo intenso
para azul en consecuencia

b) usa una rampa de color.

Rampa de color continua de rojo claro / azul a rojo profundo / azul con un mapeo continuo de valores de> 50% a 100% a colores de luz a rojo profundo / azul.

Lo que elegiste depende de lo que quieras comunicar con el mapa. Si la información "está ganando" y "está ganando xy%" es suficiente, elija a). Si sus lectores deben poder estimar cuántos% de candidato rojo o azul lidera, elija b)

— Chris P
fuente