Variable de escala como datos de recuento: ¿correcto o no?

En este documento (disponible gratuitamente a través de PubMed central), los autores utilizan la regresión binomial negativa para modelar la puntuación en un instrumento de detección de 10 ítems con una puntuación de 0-40. Este procedimiento asume datos de recuento, que claramente no es el caso aquí. Me gustaría conocer su opinión sobre si este enfoque es aceptable, porque a veces uso el mismo instrumento o similares en mi trabajo. Si no, me gustaría saber si hay alternativas aceptables. Más detalles a continuación:

La escala utilizada es la Prueba de identificación de trastornos por consumo de alcohol (AUDIT), un cuestionario de 10 ítems diseñado como un instrumento de detección para el trastorno por consumo de alcohol y el consumo peligroso / nocivo. El instrumento se puntúa de 0 a 40, y los resultados suelen estar muy sesgados a la izquierda.

Según tengo entendido, el uso de datos de recuento supone que todos los valores que se "cuentan" son independientes entre sí: los pacientes que acuden a una sala de emergencias cada día, la cantidad de muertes en un determinado grupo, etc., todos son independientes entre sí, aunque dependiente de las variables subyacentes. Además, creo que no puede haber un recuento máximo permitido cuando se usan datos de recuento, aunque creo que esta suposición se puede relajar cuando el máximo teórico es muy alto en comparación con el máximo observado en los datos.

Cuando usamos la escala AUDIT, no tenemos un conteo verdadero. Tenemos 10 ítems con un puntaje total máximo de 40, aunque esos puntajes altos rara vez se ven en la práctica. Las puntuaciones en los ítems están naturalmente correlacionadas entre sí.

Por lo tanto, se violan los supuestos necesarios para usar los datos de conteo. Pero, ¿sigue siendo un enfoque aceptable? ¿Qué tan graves son las violaciones de los supuestos? ¿Existen ciertas circunstancias bajo las cuales este enfoque puede considerarse más aceptable? ¿Hay alguna alternativa a este enfoque que no implique reducir la variable de escala a categorías?

regression negative-binomial count-data

— JonB
fuente

Respuestas:

El instrumento AUDIT es esencialmente una escala Likert. Un conjunto de preguntas (ítems Likert), con respuestas a menudo en una escala de cinco puntos, está diseñado para llegar a algún fenómeno subyacente. La suma de las respuestas al conjunto de preguntas, la escala Likert, se utiliza como medida del fenómeno subyacente. Aunque los elementos de Likert son a menudo en una escala de "muy en desacuerdo" a "totalmente de acuerdo", la aplicación para medir la tendencia a " Un LCOHOL T SE D RASTORNOS" en este " I DENTIFICACIÓN T est" es sencillo.

Como se señaló en la página Wikipedia de la escala Likert , "Si los elementos Likert individuales pueden considerarse como datos a nivel de intervalo, o si deben tratarse como datos categóricos ordenados es objeto de un considerable desacuerdo en la literatura, con fuertes convicciones sobre lo que son los métodos más aplicables ". Esta disputa probablemente se remonta a la mayoría de los más de 80 años desde que Likert propuso por primera vez la escala: ¿cada paso en la escala es equivalente, tanto dentro como entre los elementos que componen la escala? El problema se ha abordado en Cross Validated, como en las respuestas a esta pregunta , una de las primeras preguntas formuladas en este sitio.

Si acepta la idea de que la escala tiene pasos que son uniformes (o lo suficientemente cercanos como para la aplicación en cuestión, tal vez promediada agregando 10 elementos diferentes, como en AUDIT), entonces son posibles varios enfoques para el análisis. Una es considerar la respuesta en la escala como una serie de pasos elegidos o no elegidos para subir la escala, con la misma probabilidad de subir cada uno de los pasos.

Esto permite pensar en " datos de escala Likert de n puntos como n ensayos de un proceso binomial ", como en una pregunta de 2010 de @MikeLawrence. Aunque las respuestas a esa pregunta no respaldaron terriblemente esa idea, no fue difícil encontrar rápidamente hoy un estudio de 2014 que utilizó y amplió este enfoque con éxito para distinguir subpoblaciones con diferentes probabilidades binomiales. Aunque a menudo se usa un proceso binomial para modelar datos de recuento, se puede usar para modelar el número, el recuento, de los pasos que un individuo tomó a lo largo de la escala de "Trastornos por consumo de alcohol".

Como señaló @Scortchi en una respuesta a la pregunta vinculada en el segundo párrafo, una limitación del modelo binomial es que impone una relación particular entre la media y la varianza de la respuesta. El binomio negativo elimina esa restricción, con la pérdida de la fácil interpretación proporcionada por el modelo binomial simple. En el análisis, el parámetro adicional que debe ajustarse usa solo un grado adicional de libertad. En contraste, tratar de especificar diferentes probabilidades para cada uno de los 40 pasos del elemento Likert y su suma en la escala Likert sería desalentador.

Como señaló @MatthewGraves en su respuesta a esta pregunta, si el modelo binomial negativo es apropiado se responde mejor examinando los residuos. En el estudio original que desarrolló AUDIT, un valor de 8 o más en la escala de 40 puntos tenía una especificidad y sensibilidad bastante razonables para distinguir a los diagnosticados por "consumo de alcohol peligroso o nocivo" en 6 países diferentes. Entonces, quizás sería mejor un modelo binomial de dos poblaciones basado en poblaciones de alto y bajo riesgo, similar al estudio de 2014 vinculado anteriormente.

Los interesados en AUDIT específicamente deben examinar ese estudio original. Por ejemplo, aunque la necesidad de una bebida matutina puede parecer medir algo completamente diferente de la frecuencia de la bebida, como supuso @SeanEaster, la bebida matutina tiene una correlación media ponderada de 0,73 con una escala de medidas de consumo de alcohol. (Ese resultado no es sorprendente para alguien que ha tenido amigos con trastornos por consumo de alcohol). AUDIT parece ser un buen ejemplo de las compensaciones necesarias para desarrollar un instrumento que pueda usarse de manera confiable en múltiples culturas.

— EdM
fuente

Gracias por una buena respuesta Al mirar mis propios datos de AUDITORÍA de más de 20000 individuos, la forma se ve cercana a una distribución binomial negativa, por lo que podría ser razonable usar esa suposición de distribución, o tal vez podría usarse un modelo cuasi-poisson. Si usamos una distribución binomial al considerar los puntos como k éxitos de 40 ensayos de Bernoulli, ¿no tendremos un problema serio con la sobredispersión? Se ve así en mis datos. ¿Podría ser cuasi-binomial una alternativa?

— JonB

Mucho depende de por qué está modelando los puntajes de AUDITORÍA 0-40 y qué interpretación heurística desea colocar en los resultados. Si todo lo que desea es una relación de los puntajes de AUDIT con otras variables, con una interpretación limitada de los valores de los parámetros de distribución, utilice una distribución que proporcione residuos con buen comportamiento; Sus sugerencias son razonables. Ajustar un solo binomio a los datos es problemático, pero una mezcla de 2 binomios (grupos de alto y bajo riesgo) con diferentes p podría ser informativa. Use su juicio basado en su conocimiento del tema.

— EdM

$x=40$ $x\ge 40$

Como comentario general, los diferentes sabores de regresión tienen antecedentes diferentes para los parámetros (es decir, regularización) y diferentes modelos de ruido. La regresión estándar de mínimos cuadrados tiene un modelo de ruido gaussiano, la regresión binomial negativa tiene un modelo de ruido binomial negativo, y así sucesivamente. La verdadera prueba de si un modelo de regresión es apropiado o no es si el ruido residual tiene o no la distribución esperada.

Por lo tanto, puede aplicar una regresión binomial negativa a sus datos, calcular los residuos y luego trazarlos en una gráfica de probabilidad binomial negativa, y tener una idea de si el modelo es apropiado o no. Si el ruido está estructurado de alguna otra manera, entonces debemos buscar un modelo de ruido que se ajuste más a esa estructura.

El razonamiento desde el modelo generativo hasta la estructura de ruido es útil: si sabemos que los datos son multiplicativos en lugar de aditivos, por ejemplo, buscamos lo lognormal en lugar de lo normal, pero si el modelo generativo esperado y la estructura de ruido no están de acuerdo, ir con los datos, no la expectativa.

— Matthew Graves
fuente

Interesante, no sabía que los eventos podrían ser "contagiosos". ¿Qué quieres decir con reemplazar x = 40 con x> = 40, en la práctica? ¿Cómo hago una gráfica de probabilidad binomial negativa en R? ¿Supongo que no te refieres a los residuos de la trama contra los valores ajustados? ¿Te refieres a una trama QQ?

— JonB

@ JonB Suponga que tiene un binomio negativo con r = 1 y probabilidad de éxito p = .9. La probabilidad de sobrevivir 40 ensayos exactamente es 0.148%; La probabilidad de sobrevivir 40 o más ensayos es 1.48%. Entonces, uno puede definir una probabilidad bien formada en el dominio [0,40] usando el binomio negativo para [0,39] y luego configurando [40] de modo que sume uno, lo que debido a que la distribución binomial negativa está bien- formado es la probabilidad de que sea 40 o más.

— Matthew Graves

@ JonB Exactamente, me refiero a una trama QQ. No lo he hecho en R antes, pero espero que este enlace me ayude.

— Matthew Graves

Hice un experimento con algunos datos con puntuaciones de AUDIT. Al crear un gráfico qq, necesito crear un vector aleatorio de resultados a partir de una distribución binomial negativa. La mu / theta viene dada por mi modelo de regresión, pero ¿cómo puedo saber qué "tamaño" usar? Lo siento si esta es una pregunta específica de R .. De todos modos, ¿tiene una buena referencia que pueda leer más sobre la aplicación de binomio negativo (y otras distribuciones) a este tipo de escalas construidas sumando varios elementos que miden el tipo del mismo proceso?

— JonB

Hice algunos experimentos adicionales ahora. Simulé un conjunto de datos con dos variables: x e y. 50% son x = 0, 50% son x = 1. Los que son x = 0 tienen una probabilidad de 0.2 para y = 1, y los que son x = 1 tienen una probabilidad de 0.4 para y = 1. Luego realicé una regresión logística y eché un vistazo a los residuos. No se ven distribuidos binomialmente en absoluto. De hecho, (por supuesto) toman 4 valores específicos. ¿Está seguro de que el patrón residual siempre debe coincidir con el supuesto de distribución? Porque en este caso, está claramente mal.

— JonB