Contexto:
Mientras tanto, he adquirido un conjunto de heurísticas sobre cómo trazar efectivamente la asociación entre dos variables numéricas. Me imagino que la mayoría de las personas que trabajan con datos tendrían un conjunto similar de reglas.
Ejemplos de tales reglas pueden ser:
- Si una de las variables está sesgada positivamente, considere trazar ese eje en una escala logarítmica.
- Si hay muchos puntos de datos (p. Ej., N> 1000), adopte una estrategia diferente, como usar alguna forma de transparencia parcial o muestrear los datos;
- Si una de las variables toma un número limitado de categorías discretas, considere usar una fluctuación de fase o un diagrama de girasol;
- Si hay tres o más variables, considere usar una matriz de diagrama de dispersión;
- Ajustar alguna forma de línea de tendencia a menudo es útil;
- Ajuste el tamaño del carácter de trazado al tamaño de la muestra (para n más grande, use un carácter de trazado más pequeño);
- y así.
Pregunta:
Me gustaría poder referir a los estudiantes a una página web o sitio que explique estos y otros trucos para trazar efectivamente asociaciones entre dos variables numéricas, tal vez con ejemplos.
- ¿Hay páginas o sitios en Internet que hagan un buen trabajo?