Estoy buscando correlaciones entre las respuestas a diferentes preguntas en una encuesta ("mmm, veamos si las respuestas a la pregunta 11 se correlacionan con las de la pregunta 78"). Todas las respuestas son categóricas (la mayoría van de "muy infeliz" a "muy feliz"), pero algunas tienen un conjunto diferente de respuestas. La mayoría de ellos se pueden considerar ordinales, así que consideremos este caso aquí.
Como no tengo acceso a un programa de estadísticas comerciales, debo usar R.
Probé Rattle (un paquete de minería de datos gratuito para R, muy ingenioso) pero desafortunadamente no admite datos categóricos. Un truco que podría usar es importar en R la versión codificada de la encuesta que tiene números (1..5) en lugar de "muy infeliz" ... "feliz" y dejar que Rattle crea que son datos numéricos.
Estaba pensando en hacer un diagrama de dispersión y tener el tamaño del punto proporcional al número de números para cada par. Después de buscar en Google, encontré http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/ pero parece muy complicado (para mí).
No soy un estadístico (sino un programador), pero he leído algo sobre el asunto y, si lo entiendo correctamente, el rho de Spearman sería apropiado aquí.
Entonces, la versión corta de la pregunta para quienes tienen prisa: ¿hay alguna manera de trazar rápidamente el rho de Spearman en R ? Una gráfica es preferible a una matriz de números porque es más fácil de mirar y también se puede incluir en los materiales.
Gracias de antemano.
PD: Pensé por un momento si publicar esto en el sitio principal de SO o aquí. Después de buscar en ambos sitios la correlación R, sentí que este sitio es más adecuado para la pregunta.