¿Es apropiado tratar los datos de la escala Likert de n puntos como n ensayos de un proceso binomial?


11

Nunca me ha gustado cómo las personas suelen analizar datos de escalas Likert como si el error fuera continuo y gaussiano cuando hay expectativas razonables de que estos supuestos se violen al menos en los extremos de las escalas. ¿Qué opinas de la siguiente alternativa:

Si la respuesta toma el valor en una escala de puntos, expanda esos datos a ensayos, de los cuales tienen el valor 1 y del valor 0. Por lo tanto, estamos tratando la respuesta en una escala Likert como si es el agregado manifiesto de una serie encubierta de ensayos binomiales (de hecho, desde una perspectiva de ciencia cognitiva, este es realmente un modelo atractivo para los mecanismos involucrados en tales escenarios de toma de decisiones). Con los datos expandidos, ahora puede usar un modelo de efectos mixtos que especifica el encuestado como un efecto aleatorio (también pregunta como efecto aleatorio si tiene varias preguntas) y usar la función de enlace binomial para especificar la distribución de errores.n n k n - kknnknk

¿Alguien puede ver alguna violación de suposición u otros aspectos perjudiciales de este enfoque?


2
¿Conoces alguna investigación publicada que analice los méritos relativos del uso de escalas likert como intervalos versus datos ordinales? Quizás, los defectos de tratarlos como escalas de nivel de intervalo no son lo suficientemente graves como para justificar un enfoque complejo. Si ese es el caso, entonces su enfoque puede ser simplemente una persecución salvaje.

Respuestas:


16

No conozco ningún artículo relacionado con su pregunta en la literatura psicométrica. Me parece que los modelos logísticos ordenados que permiten componentes de efectos aleatorios pueden manejar esta situación bastante bien.

Estoy de acuerdo con @Srikant y creo que un modelo de probabilidades proporcionales o un modelo probit ordenado (dependiendo de la función de enlace que elija) podría reflejar mejor la codificación intrínseca de los elementos Likert y su uso típico como escalas de calificación en encuestas de opinión / actitud o cuestionarios .

Otras alternativas son: (1) el uso de categorías adyacentes en lugar de proporcionales o acumulativas (donde hay una conexión con modelos log-lineales); (2) uso de modelos de respuesta al ítem como el modelo de crédito parcial o el modelo de escala de calificación (como se mencionó en mi respuesta en el análisis de escalas Likert ). El último caso es comparable a un enfoque de efectos mixtos, con sujetos tratados como efectos aleatorios, y está fácilmente disponible en el sistema SAS (p. Ej., Modelos de ajuste de efectos mixtos para resultados ordinales repetidos con el procedimiento NLMIXED ) o R (ver vol. 20 de la Revista de Software Estadístico ). También podría estar interesado en la discusión brindada por John Linacre sobre Optimización de la efectividad de la categoría de escala de calificación .

Los siguientes documentos también pueden ser útiles:

  1. Wu, CH (2007). Un estudio empírico sobre la transformación de datos de escala Likert a puntajes numéricos . Ciencias Matemáticas Aplicadas , 1 (58) : 2851-2862.
  2. Rost, J y Luo, G (1997). Una aplicación de un modelo de despliegue basado en Rasch a un cuestionario sobre centrismo adolescente . En Rost, J y Langeheine, R (Eds.), Aplicaciones del rasgo latente y modelos de clase latentes en las ciencias sociales , Nueva York: Waxmann.
  3. Lubke, G y Muthen, B (2004). El análisis factorial de datos de escala Likert bajo el supuesto de normalidad multivariante complica una comparación significativa de grupos observados o clases latentes . Modelado de ecuaciones estructurales , 11 : 514-534.
  4. Nering, ML y Ostini, R (2010). Manual de modelos de teoría de respuesta a elementos politómicos . Routledge Academic
  5. Bender R y Grouven U (1998). Uso de modelos de regresión logística binaria para datos ordinales con probabilidades no proporcionales. Journal of Clinical Epidemiology , 51 (10) : 809-816. (No puedo encontrar el pdf pero este está disponible, regresión logística ordinal en investigación médica )

1
La regresión logística ordinal de efectos mixtos también está disponible en R con el paquete ordinal y clmm ().
John

9

Si realmente desea abandonar la suposición de datos de nivel de intervalo para escalas likert, le sugiero que suponga que los datos son un logit o probit ordenado. Las escalas Likert generalmente miden la fuerza de la respuesta y, por lo tanto, los valores más altos deberían indicar una respuesta más fuerte en el elemento de interés subyacente.

Suponga que tiene una escala de ítem y que representa la fuerza de respuesta no observada en el ítem de interés. Entonces puede asumir el siguiente modelo de respuesta:SHS

S α 1y=1 siSα1

α h - 1 < S α h h = 2 , 3 , . . H - 1y=h  if paraαh1<S αhh=2,3,..H1

α H - 1 < S < y=H  ifαH1<S< 

Suponiendo que sigue una distribución normal con una media y varianza desconocidas, se obtendría un modelo probit ordenado.S


2

Una preocupación sería que al usar este enfoque, está imponiendo una relación específica entre la media y la varianza de la respuesta. Para el tipo de encuestas a menudo se usan escalas Likert, por ejemplo, usted elige una de las cinco categorías entre "Totalmente de acuerdo" y "Totalmente en desacuerdo" con respecto a alguna afirmación u otra, me parece mal. Por ejemplo, esperaría que una escala de diez puntos ofrezca aproximadamente la misma distribución de respuestas que una escala de cinco puntos si contrae pares de categorías adyacentes: para una respuesta & commonnpnp(1p)yp

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
Recuerdo algunas investigaciones que parecen confirmar esto: Coelho y Esteves (2006), "La elección entre una escala de cinco puntos y una de diez puntos en el marco de la medición de la satisfacción del cliente".

1

Puede usar la aproximación binomial en una escala Likert de 5 puntos si combina el acuerdo y el acuerdo total en un grupo y el desacuerdo y el desacuerdo total en otro. Por supuesto, aún debes decidir a dónde van los neutrales. Pondría los neutrales en cualquier grupo, usaría la aproximación normal al binomio (siempre que tenga más de 40 respuestas) y desarrolle intervalos de confianza en las proporciones de cada grupo (vea cualquier texto estándar de estadísticas sobre cómo obtener conf. intervalos en proporciones procedentes de una distribución binomial con la aproximación normal). Luego, pondría a los neutrales en el otro grupo y rehacería los intervalos de confianza. Si obtengo la misma conclusión de ambos, entonces hay una conclusión potencial. De lo contrario, no veo cómo se puede usar el binomio con los datos de Likert.


0

Si entendí correctamente, este documento sugiere un enfoque muy similar a lo que ha descrito, sugiriendo que sí, de hecho, los datos tipo Likert pueden surgir de un proceso binomial.

Referencia completa: Allik, J. (2014). Un modelo binomial mixto para medidas de personalidad tipo Likert. Fronteras en psicología , (5) 371


Bienvenido al sitio! ¿Podría agregar una referencia completa para ese documento? Es una práctica estándar aquí porque los enlaces tienden a fallar.
mkt - Restablecer Monica

-1

En realidad, estoy preparando un documento en el que estoy usando su enfoque de tratar una respuesta en un elemento similar como si fuera el agregado manifiesto de una serie encubierta de ensayos binomiales.

En mi trabajo, la distribución binomial se usa para explicar la forma de las distribuciones de frecuencia observadas. La razón detrás de este enfoque viene dada por dos supuestos. En muchos applets, que muestran cómo se produce la distribución binomial, uno ha repetido ensayos independientes de Bernoulli con una sola bola que cae a través de una serie de alfileres. Cada vez que una pelota cae sobre un alfiler, rebota hacia la derecha (es decir, un éxito) con probabilidad p o hacia la izquierda (es decir, un fallo) con probabilidad 1-p. Después de que la bola cae a través de la matriz, aterriza en un contenedor etiquetado por el número correspondiente de éxitos. En mi trabajo, el proceso de toma de decisiones también se ve como una serie de ensayos independientes repetidos de Bernoulli en los que, en cada ensayo, el sujeto decide aceptar o no la declaración en cuestión.

(i) En cada ensayo independiente de Bernoulli, el sujeto toma la decisión de estar de acuerdo con la probabilidad p o no estar de acuerdo (en desacuerdo) con la probabilidad 1-p.

(ii) Si hay cinco categorías de respuesta disponibles para la declaración, el número de veces que se toma una decisión de Bernoulli con respecto a la decisión de aceptar o no (no estar de acuerdo) es igual a 4 (5-1).

La elección final para una categoría de respuesta específica está dada por las siguientes reglas.

  • Si en los (cuatro) casos se toma una decisión de acuerdo de Bernoulli, se dará la respuesta 'totalmente de acuerdo'.

  • Si en tres casos se toma una decisión de acuerdo de Bernoulli, se dará la respuesta 'de acuerdo'.

  • Si en dos casos se toma una decisión de acuerdo de Bernoulli, se dará la respuesta 'indeciso'.

  • Si en un solo caso se toma una decisión de acuerdo de Bernoulli, se dará la respuesta "en desacuerdo".

  • Si en ningún caso se toma una decisión de acuerdo de Bernoulli, se dará la respuesta "totalmente en desacuerdo".

Se puede dar un razonamiento similar utilizando decisiones "en desacuerdo". Para obtener una distribución binomial, la puntuación de las categorías de respuesta es la siguiente.

totalmente en desacuerdo = 0, en desacuerdo = 1, neutral = 2, de acuerdo = 3, totalmente de acuerdo = 4

Estos dos supuestos conducen a una distribución binomial para las frecuencias de respuesta, siempre que no haya diferencias sistemáticas entre los encuestados.

Espero que puedas estar de acuerdo. Apreciaría mucho si pudieras mejorar mi inglés en el texto anterior.


He eliminado tu respuesta anterior. Tenga en cuenta que mi comentario no fue un comentario negativo; Las respuestas de una línea generalmente no son muy informativas y se prefieren las respuestas discutibles (pero consulte nuestras preguntas frecuentes ).
chl

1
Esta es una propuesta interesante y creativa, pero soy escéptico al respecto. Tanto en su versión como en la regresión logística ordinal como se sugiere, por ejemplo, por otros en este hilo requerirá la suposición de probabilidades proporcionales. Sin embargo, OLR permitirá que los umbrales / puntos de corte b / t las categorías varíen de manera más flexible, creo, mientras que estarán determinados por los parámetros binomiales & en su esquema. Esta suposición tendría que verificarse contra los datos, y sospecho que conduciría a problemas. (Por cierto, el -1 no vino de mí.)npn
Gung - Restablecer Mónica
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.