En mi campo, la forma habitual de graficar datos emparejados es como una serie de segmentos de línea delgada y delgada, superpuestos con la mediana y el IC de la mediana para los dos grupos:
Sin embargo, este tipo de gráfico se vuelve mucho más difícil de leer a medida que aumenta el número de puntos de datos (en mi caso tengo del orden de 10000 pares):
Reducir el alfa ayuda un poco, pero aún no es genial. Mientras buscaba una solución, me encontré con este documento y decidí intentar implementar un 'diagrama de línea paralela'. Nuevamente, funciona muy bien para pequeños números de puntos de datos:
Pero es aún más difícil hacer que este tipo de trama se vea bien cuando el es muy grande:
Supongo que podría mostrar por separado las distribuciones para los dos grupos, por ejemplo, con diagramas de caja o violines, y trazar una línea con barras de error en la parte superior que muestre las dos medianas / CI, pero realmente no me gusta esa idea, ya que no transmitiría La naturaleza pareada de los datos.
Tampoco estoy demasiado interesado en la idea de un diagrama de dispersión 2D: preferiría una representación más compacta, e idealmente una en la que los valores para los dos grupos se tracen a lo largo del mismo eje. En aras de la exhaustividad, así es como se ven los datos como una dispersión 2D:
¿Alguien sabe de una mejor manera de representar datos emparejados con un tamaño de muestra muy grande? ¿Me podría vincular a algunos ejemplos?
Editar
Lo siento, claramente no he hecho un buen trabajo al explicar lo que estoy buscando. Sí, el diagrama de dispersión 2D funciona, y hay muchas maneras en que podría mejorarse para transmitir mejor la densidad de los puntos: podría codificar con color los puntos según una estimación de densidad del núcleo, podría hacer un histograma 2D , Podría trazar contornos en la parte superior de los puntos, etc., etc.
Sin embargo, creo que esto es excesivo para el mensaje que estoy tratando de transmitir. Realmente no me importa mostrar la densidad 2D de puntos per se , todo lo que necesito hacer es mostrar que los valores para 'barras' son generalmente más grandes que los de 'puntos', de la manera más simple y clara posible , y sin perder la naturaleza esencial emparejada de los datos. Idealmente, me gustaría trazar los valores emparejados para los dos grupos a lo largo de los mismos ejes en lugar de ejes ortogonales, ya que esto hace que sea más fácil compararlos visualmente.
Tal vez no haya una mejor opción que un diagrama de dispersión, pero me gustaría saber si hay alguna alternativa que pueda funcionar.
bar
en eldot
eje horizontal y vertical como un diagrama de dispersión?