Muchos estudios en ciencias sociales usan escalas Likert. ¿Cuándo es apropiado usar los datos de Likert como ordinales y cuándo es apropiado usarlos como datos de intervalo?
Muchos estudios en ciencias sociales usan escalas Likert. ¿Cuándo es apropiado usar los datos de Likert como ordinales y cuándo es apropiado usarlos como datos de intervalo?
Respuestas:
Tal vez sea demasiado tarde, pero agrego mi respuesta de todos modos ...
Depende de lo que intente hacer con sus datos: si está interesado en mostrar que los puntajes difieren al considerar diferentes grupos de participantes (género, país, etc.), puede tratar sus puntajes como valores numéricos, siempre que cumplan con los supuestos habituales sobre la varianza (o forma) y el tamaño de la muestra. Si está bastante interesado en resaltar cómo varían los patrones de respuesta entre los subgrupos, entonces debe considerar los puntajes de los ítems como una elección discreta entre un conjunto de opciones de respuesta y buscar modelos log-lineales, regresión logística ordinal, modelos de respuesta a ítems o cualquier otro modelo estadístico que permite hacer frente a elementos politómicos.
Como regla general, generalmente se considera que tener 11 puntos distintos en una escala es suficiente para aproximar una escala de intervalo (para fines de interpretación, vea el comentario de @ xmjx). Los ítems Likert pueden considerarse como una verdadera escala ordinal, pero a menudo se usan como numéricos y podemos calcular su media o DE. Esto a menudo se realiza en encuestas de actitud, aunque es aconsejable informar tanto la media / DE como el% de respuesta en, por ejemplo, las dos categorías más altas.
Cuando se usan puntajes de escala sumados (es decir, sumamos puntaje en cada ítem para calcular un "puntaje total"), se pueden aplicar estadísticas habituales, pero debe tener en cuenta que ahora está trabajando con una variable latente, por lo que la construcción subyacente debería tener sentido! En psicometría, generalmente verificamos que (1) la unidimensionalidad de la escala se mantiene, (2) la confiabilidad de la escala es suficiente. Al comparar dos puntajes de escala de este tipo (para dos instrumentos diferentes), incluso podríamos considerar el uso de medidas de correlación atenuadas en lugar del coeficiente de correlación clásico de Pearson.
Los libros de texto clásicos incluyen:
1. Nunnally, JC y Bernstein, IH (1994). Teoría psicométrica (3ª ed.). Serie McGraw-Hill en Psicología.
2. Streiner, DL y Norman, GR (2008). Escalas de medición de salud. Una guía práctica para su desarrollo y uso (4ª ed.). Oxford
3. Rao, CR y Sinharay, S., Eds. (2007) Manual de estadísticas, vol. 26: Psicometría . Elsevier Science BV
4. Dunn, G. (2000). Estadística en psiquiatría . Hodder Arnold.
También puede echar un vistazo a Aplicaciones de rasgos latentes y modelos de clase latentes en las ciencias sociales , de Rost & Langeheine, y el sitio web de W. Revelle sobre investigación de la personalidad .
Al validar una escala psicométrica, es importante tener en cuenta los denominados efectos techo / suelo (gran asimetría resultante de que los participantes puntúen en la categoría de respuesta más baja / más alta), lo que puede afectar seriamente cualquier estadística calculada al tratarlos como variable numérica ( por ejemplo, agregación de país, prueba t). Esto plantea problemas específicos en los estudios interculturales, ya que se sabe que la distribución general de la respuesta en las encuestas de actitud o salud difiere de un país a otro (por ejemplo, los chinos frente a los que provienen de países occidentales tienden a resaltar un patrón de respuesta específico, el primero tiene generalmente puntuaciones más extremas a nivel de ítem, véase, por ejemplo, Song, X.-Y. (2007) Análisis de modelos de ecuaciones estructurales de múltiples muestras con aplicaciones a datos de Calidad de Vida, enManual de variables latentes y modelos relacionados , Lee, S.-Y. (Ed.), Pp 279-302, Holanda del Norte).
En términos más generales, debe consultar la literatura relacionada con la psicometría que hace un uso extensivo de los artículos de Likert si está interesado en el tema de la medición. Se han desarrollado varios modelos estadísticos y actualmente se encuentran bajo el marco de la Teoría de respuesta al ítem.
La respuesta simple es que las escalas Likert son siempre ordinales. Los intervalos entre las posiciones en la escala son monótonos pero nunca tan bien definidos como para ser incrementos numéricamente uniformes.
Dicho esto, la distinción entre ordinal e intervalo se basa en las demandas específicas del análisis que se realiza. En circunstancias especiales, puede tratar las respuestas como si cayeran en una escala de intervalos. Para hacer esto, generalmente los encuestados deben estar de acuerdo con respecto al significado de las respuestas de la escala y el análisis (o las decisiones tomadas con base en el análisis) deben ser relativamente insensibles a los problemas que puedan surgir.
Además de lo que ya se ha dicho anteriormente sobre las escalas sumadas, también mencionaría que el problema puede cambiar al analizar los datos a nivel de grupo. Por ejemplo, si estuvieras examinando
En todos estos casos, cada medida agregada (quizás la media) se basa en muchas respuestas individuales (p. Ej., N = 50, 100, 1000, etc.). En estos casos, el elemento Likert original comienza a adquirir propiedades que se asemejan a una escala de intervalo a nivel agregado.
escala likert siempre en forma ordinal: un método para atribuir valor cuantitativo a datos cualitativos, para que sea susceptible de análisis estadístico. Se asigna un valor numérico a cada opción potencial y se calcula una cifra media para todas las respuestas al final de la evaluación o encuesta.