Me he encontrado con una serie de preguntas prácticas al modelar datos de conteo de investigaciones experimentales utilizando un experimento dentro del sujeto. Describo brevemente el experimento, los datos y lo que he hecho hasta ahora, seguido de mis preguntas.
Se mostraron cuatro películas diferentes a una muestra de encuestados en secuencia. Después de cada película, se realizó una entrevista de la cual contamos el número de ocurrencias de ciertas declaraciones que eran de interés para el RQ (variable de conteo pronosticado). También registramos el número máximo de ocurrencias posibles (unidades de codificación; variable de desplazamiento). Además, se midieron varias características de las películas en una escala continua, de las cuales para una tenemos una hipótesis causal de un efecto de la función de la película en el recuento de declaraciones mientras que las otras son de control (predictores).
La estrategia de modelado adoptada hasta ahora es la siguiente:
Estime un modelo de Poisson de efecto aleatorio, donde la variable causal se usa como covariable y las otras variables como covariables de control. Este modelo tiene un desplazamiento igual a 'log (unidades)' (unidades de codificación). Se toman efectos aleatorios en todos los sujetos (los recuentos específicos de películas se anidan en los sujetos). Encontramos la hipótesis causal confirmada (coeficiente sig. De variable causal). En estimación, utilizamos el paquete lme4 en R, en particular la función glmer.
Ahora tengo las siguientes preguntas. Un problema común en la regresión de Poisson es la sobredispersión. Sé que esto se puede probar utilizando una regresión binomial negativa y evaluando si su parámetro de dispersión mejora el ajuste del modelo de un modelo de Poisson simple. Sin embargo, no sé cómo hacerlo en un contexto de efectos aleatorios.
- ¿Cómo debo hacer una prueba de dispersión excesiva en mi situación? Probé la dispersión excesiva en una simple regresión binomial negativa / de Poisson (sin efectos aleatorios) que sé cómo encajar. La prueba sugiere la presencia de sobredispersión. Sin embargo, dado que estos modelos no tienen en cuenta la agrupación, supongo que esta prueba es incorrecta. Tampoco estoy seguro sobre el papel del desplazamiento para las pruebas de sobredispersión.
- ¿Hay algo así como un modelo de regresión de efectos aleatorios binomiales negativos y cómo debo ajustarlo en R?
- ¿Tiene sugerencias para modelos alternativos que debería probar con los datos, es decir, teniendo en cuenta la estructura de medidas repetidas, las variables de conteo y la exposición (unidades de codificación)?