Estoy tratando de modelar datos de conteo en R que aparentemente están poco dispersos (Parámetro de dispersión ~ .40). Esta es probablemente la razón por la cual un modelo binomial ( ) glm
con family = poisson
o negativo glm.nb
no es significativo. Cuando miro los descriptivos de mis datos, no tengo el sesgo típico de los datos de conteo y los residuos en mis dos condiciones experimentales también son homogéneos.
Entonces mis preguntas son:
¿Tengo que usar análisis de regresión especiales para mis datos de conteo, si mis datos de conteo realmente no se comportan como datos de conteo? A veces me enfrento a la no normalidad (generalmente debido a la curtosis), pero utilicé el método de arranque por percentil para comparar las medias recortadas (Wilcox, 2012) para explicar la no normalidad. ¿Se pueden sustituir los métodos para contar datos por cualquier método robusto sugerido por Wilcox y realizado en el paquete WRS?
Si tengo que usar análisis de regresión para los datos de recuento, ¿cómo considero la subdispersión? El Poisson y la distribución binomial negativa suponen una mayor dispersión, por lo que no debería ser apropiado, ¿verdad? Estaba pensando en aplicar la distribución cuasi-Poisson , pero eso generalmente se recomienda para la sobredispersión. Leí acerca de los modelos beta-binomiales que parecen ser capaces de explicar la dispersión excesiva o insuficiente en el
VGAM
paquete de R. Sin embargo, los autores parecen recomendar una distribución inclinada de Poisson , pero no puedo encontrarla en el paquete .
¿Alguien puede recomendar un procedimiento para datos poco dispersos y tal vez proporcionar algún código R de ejemplo para ello?