Estoy de acuerdo en que el gráfico es engañoso en el sentido de que pretende mostrar que no hay puntos de datos en el cuadrante que se describe categóricamente como% de voto alto,% alto de graduados. Lo que es alto y bajo se vuelve relativo a los límites del eje, no a los datos reales. Aunque teóricamente es posible tener un barrio con una población 100% universitaria, dicho barrio no existe. No necesita inventar puntos de datos para producir un gráfico engañoso: un eje roto que muestra un cambio exagerado es un ejemplo que no es muy diferente a este.
Una forma más objetiva de visualizar estos datos sería establecer los límites del eje del diagrama de dispersión en el máximo / mínimo de los datos y luego dividir el gráfico en cuadrantes de un área igual.
La razón por la que elegiría el área igual de cuadrantes es para que los cuadrantes muestren una relación lineal equivalente entre variables. Las descripciones categóricas de los cuadrantes, "alto" y "bajo" se tratan como equivalentes, por lo que las áreas también deberían serlo.
Si, en cambio, queremos usar cuadrantes como otra forma de describir datos cuantitativamente, podríamos establecer los bordes de los cuadrantes en el promedio de cada variable como se muestra en la Visualización de datos con R: 100 ejemplos (disponibles para previsualizar en Google Books, p283,286).
Para agregar otra capa analítica a una visualización de diagrama de dispersión, podemos usar el color y el tamaño de los puntos. Por ejemplo, el color puede usarse para separar las ciudades universitarias del resto, mostrar la participación de los votantes en un gradiente o resaltar los resultados de las Elecciones Generales para esos barrios. No estoy seguro de si el tamaño será efectivo con tantos puntos de datos, pero potencialmente puede investigar diferentes bandas de población, como 65+, y cómo se representan en los datos.
En mi opinión, también hay dos advertencias importantes que vale la pena tener en cuenta al mirar este gráfico: primero, que cuenta a todos los graduados, independientemente de si votaron en el referéndum o no, y en segundo lugar, que incluye a los graduados residentes con pasaportes de la UE que no se pudo votar en el referéndum (suponiendo que la fuente de datos esté basada en el censo).