Tengo datos para los que calculé la correlación de Spearman y quiero visualizarlos para una publicación. La variable dependiente se clasifica, la variable independiente no. Lo que quiero visualizar es más la tendencia general que la pendiente real, por lo que clasifiqué la independiente y apliqué la correlación / regresión de Spearman. Pero justo cuando tracé mis datos y estaba a punto de insertarlos en mi manuscrito, me topé con esta declaración (en este sitio web ):
Casi nunca usará una línea de regresión para la descripción o la predicción cuando realice la correlación de rango de Spearman, así que no calcule el equivalente de una línea de regresión .
y después
Puede graficar los datos de correlación de rango de Spearman de la misma manera que lo haría para una regresión lineal o correlación. Sin embargo, no ponga una línea de regresión en el gráfico ; sería engañoso poner una línea de regresión lineal en un gráfico cuando la haya analizado con correlación de rango.
La cuestión es que las líneas de regresión no son tan diferentes de cuando no clasifico el independiente y calculo la correlación de Pearson. La tendencia es la misma, pero debido a las tarifas exorbitantes para los gráficos en color en las revistas, utilicé una representación monocromática y los puntos de datos reales se superponen tanto que no es reconocible.
Podría solucionar esto, por supuesto, haciendo dos trazados diferentes: uno para los puntos de datos (clasificados) y otro para la línea de regresión (sin clasificar), pero si resulta que la fuente que cité es incorrecta o el problema No es tan problemático en mi caso, me facilitaría la vida. (También vi esta pregunta , pero no me ayudó).
Editar para obtener información adicional:
La variable independiente en el eje x representa el número de características y la variable dependiente en el eje y representa el rango si los algoritmos de clasificación se comparan en su rendimiento. Ahora tengo algunos algoritmos que son comparables en promedio, pero lo que quiero decir con mi gráfico es algo así como: "Mientras el clasificador A mejora cuanto más características están presentes, el clasificador B es mejor cuando hay menos características".
Editar 2 para incluir mis tramas:
Rangos de algoritmos trazados versus el número de características
Rangos de algoritmos trazados versus el número clasificado de características
Entonces, para repetir la pregunta del título:
¿Está bien trazar una línea de regresión para los datos clasificados de una correlación / regresión de Spearman?