¿Por qué fluctuar el valor continuo en un diagrama de dispersión?


12

Estoy usando Orange Canvas y generé un diagrama de dispersión. Tengo la posibilidad de fluctuar las variables continuas, pero realmente no sé por qué haría eso.

¿Cuál es la idea detrás de los nervios?


1
Para lidiar con la sobreimpresión y, por lo tanto, dar una impresión visual menos engañosa. Si solo tiene unos pocos puntos, no necesita hacerlo.
mdewey

Para ver un ejemplo concreto de fluctuación que ayuda a ver los patrones en los datos, vea mi respuesta aquí: ¿Cómo extraer información de una matriz de diagrama de dispersión cuando tiene N grande, datos discretos y muchas variables?
gung - Restablece a Monica

Respuestas:


18

Esta publicación lo explica bien.

A menudo, cuando tiene muchos puntos superpuestos, puede ser difícil tener una idea de su densidad. Dos mil puntos en (1, 1) parecen lo mismo que un punto en (1, 1). Agregar algo de jitter convierte los puntos superpuestos en una mancha y hace que la densidad de los puntos sea obvia.


¿No se trata de datos discretos, mientras que la pregunta se hace explícitamente sobre datos continuos?
ameba dice Reinstate Monica

Agregando a lo que @amoeba dijo, esta respuesta es correcta cuando agrega que los datos continuos con los que tratamos se redondean debido a la precisión de la medición y, por lo tanto, ocurren problemas como los descritos anteriormente.
Tim
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.