Ya he leído todas las páginas de este sitio tratando de encontrar la respuesta a mi problema, pero nadie parece ser el correcto ...
Primero te explico el tipo de datos con los que estoy trabajando ...
Digamos que tengo un vector de matriz con varios nombres de ciudad, uno para cada uno de los 300 usuarios. También tengo otro vector de matriz con respuesta de puntajes a una encuesta de cada usuario o un valor continuo para cada usuario.
Me gustaría saber si existe un coeficiente de correlación que calcule la correlación entre estas dos variables, entonces, las variables nominales y numéricas / ordinales
He buscado en Internet y en algunas páginas sugieren usar el coeficiente de contingencia o el coeficiente de Cramer V o Lambda o Eta. Para cada una de estas medidas, simplemente digamos que se podrían aplicar para los datos en los que tenemos una variable nominal e intervalo o variable numérica. La cuestión es que buscar y buscar, tratando de comprender cada uno de ellos, en algún momento está escrito o observando los ejemplos de que son razonables para usarlos si tiene una variable nominal dicotómica, a excepción de Cramer's V, en otro momento no se escribe ningún requisito para El tipo de datos. Muchas otras páginas dicen que es correcto aplicar la regresión, eso es correcto, pero simplemente me gustaría saber si hay un coeficiente como pearson / spearman para este tipo de datos.
También creo que no es tan apropiado usar el coeff de correlación de Spearman ya que las ciudades no son ordenables.
También he construido la función de Cramer'sV y Eta por mí mismo (estoy trabajando con Matlab) pero para Eta no hablan de ningún valor p para ver si el coeficiente es estadísticamente significativo ...
En el sitio de matlabWorks también hay una buena caja de herramientas que dice calcular eta ^ 2, pero el tipo de entrada que necesita no es comprensible.
¿Hay alguien que haya hecho una prueba como la mía? Si necesita más detalles para comprender el tipo de datos que estoy usando, pregúnteme y trataré de explicarle mejor.