Asumiré que una variable "categórica" en realidad representa una variable ordinal; de lo contrario, no tiene mucho sentido tratarlo como continuo, a menos que sea una variable binaria (codificada 0/1) como lo señala @Rob. Entonces, diría que el problema no es tanto la forma en que tratamos la variable, aunque hasta el momento se han desarrollado muchos modelos para el análisis de datos categóricos; véase, por ejemplo, El análisis de datos categóricos ordenados: una visión general y una encuesta de recientes desarrollos de Liu y Agresti--, que la escala de medición subyacente que asumimos. Mi respuesta se centrará en este segundo punto, aunque primero discutiré brevemente la asignación de puntajes numéricos a categorías o niveles variables.
Al usar una simple recodificación numérica de una variable ordinal, está asumiendo que la variable tiene propiedades de intervalo (en el sentido de la clasificación dada por Stevens, 1946). Desde la perspectiva de la teoría de la medición (en psicología), esto a menudo puede ser una suposición demasiado fuerte, pero para el estudio básico (es decir, cuando se usa un solo elemento para expresar la opinión de uno sobre una actividad diaria con una redacción clara), cualquier puntaje monótono debería dar resultados comparables . Cochran (1954) ya señaló que
cualquier conjunto de puntajes da una
prueba válida , siempre que se construyan sin consultar los resultados del experimento. Si el conjunto de puntajes es pobre, ya que distorsiona gravemente una escala numérica que realmente subyace a la clasificación ordenada, la prueba no será sensible. Por lo tanto, los puntajes deben incorporar la mejor información disponible sobre la forma en que se construyó y usó la clasificación. (pág. 436)
(Muchas gracias a @whuber por recordarme esto a lo largo de uno de sus comentarios, que me llevó a volver a leer el libro de Agresti, del cual proviene esta cita).
En realidad, varias pruebas tratan implícitamente tales variables como escalas de intervalo: por ejemplo, el estadístico para probar una tendencia lineal (como alternativa a la independencia simple) se basa en un enfoque correlacional ( , Agresti, 2002, p. 87).M 2 = ( n - 1 ) r 2METRO2METRO2= ( n - 1 ) r2
Bueno, también puede decidir recodificar su variable en un rango irregular o agregar algunos de sus niveles, pero en este caso un fuerte desequilibrio entre categorías recodificadas puede distorsionar las pruebas estadísticas, por ejemplo, la prueba de tendencia mencionada anteriormente. @Jeromy ya propuso una buena alternativa para asignar la distancia entre categorías, a saber, la escala óptima.
Ahora, analicemos el segundo punto que hice, el del modelo de medición subyacente. Siempre dudo en agregar la etiqueta "psicometría" cuando veo este tipo de preguntas, porque la construcción y el análisis de escalas de medición se encuentran bajo la Teoría psicométrica (Nunnally y Bernstein, 1994, para una visión general ordenada). No me detendré en todos los modelos que en realidad se dirigen bajo la Teoría de la respuesta al ítem , y gentilmente remito al lector interesado a I. Tutorial de Partchev, Una guía visual de la teoría de la respuesta al ítem, para una introducción suave a IRT, y a las referencias (5-8) enumeradas al final para posibles taxonomías IRT. Muy brevemente, la idea es que, en lugar de asignar distancias arbitrarias entre categorías variables, asumas una escala latente y calcules su ubicación en ese continuo, junto con la capacidad o responsabilidad de los individuos. Un ejemplo simple vale mucha notación matemática, así que consideremos el siguiente ítem (proveniente del cuestionario de calidad de vida relacionado con la salud EORTC QLQ-C30 ):
Te preocupaste?
que está codificado en una escala de cuatro puntos, que van desde "Nada" hasta "Mucho". Los puntajes brutos se calculan asignando un puntaje de 1 a 4. Los puntajes de los elementos que pertenecen a la misma escala se pueden sumar para obtener el llamado puntaje de escala, que denota el rango de uno en la construcción subyacente (aquí, un componente de salud mental ) Estos puntajes de escala sumados son muy prácticos debido a la facilidad de puntaje (para el profesional o la enfermera), pero no son más que una escala discreta (ordenada).
También podemos considerar que la probabilidad de respaldar una categoría de respuesta dada obedece a algún tipo de modelo logístico, como se describe en el tutorial de I. Partchev, mencionado anteriormente. Básicamente, la idea es la de un tipo de modelo de umbral (que conduce a una formulación equivalente en términos de modelos de probabilidades proporcionales o acumulativas) y modelamos las probabilidades de estar en una categoría de respuesta en lugar de la anterior o las probabilidades de obtener un puntaje por encima de un cierta categoría, condicional a la ubicación de los sujetos en el rasgo latente. Además, podemos imponer que las categorías de respuesta estén igualmente espaciadas en la escala latente (este es el modelo de Escala de Calificación), que es la forma en que lo hacemos asignando puntajes numéricos espaciados regularmente o no (este es el modelo de Crédito Parcial) .
Claramente, no estamos agregando mucho a la teoría de prueba clásica, donde las variables ordinales se tratan como numéricas. Sin embargo, introducimos un modelo probabilístico, donde asumimos una escala continua (con propiedades de intervalo) y donde se pueden tener en cuenta los errores específicos de medición, y podemos conectar estos puntajes factoriales en cualquier modelo de regresión.
Referencias
- SS Stevens. En la teoría de las escalas de medición. Science , 103 : 677-680, 1946.
- WG Cochran. Algunos métodos para fortalecer las pruebas comunes de . Biometrics , 10 : 417-451, 1954.χ2
- J Nunnally y yo Bernstein. Teoría psicométrica . McGraw-Hill, 1994
- Alan Agresti. Análisis de datos categóricos . Wiley, 1990.
- CR Rao y S Sinharay, editores. Manual de Estadística, vol. 26: Psicometría . Elsevier Science BV, Países Bajos, 2007.
- A Boomsma, MAJ van Duijn y TAB Snijders. Ensayos sobre la teoría de respuesta al ítem . Springer, 2001.
- D Thissen y L Steinberg. Una taxonomía de los modelos de respuesta al ítem. Psychometrika , 51 (4) : 567-577, 1986.
- P Mair y R Hatzinger. Extended Rasch Modelado: El MTC paquete para la aplicación de los modelos de la TRI en I . Revista de software estadístico , 20 (9) , 2007.