Estoy tratando de diseñar por mí mismo cuando es apropiado usar qué tipo de regresión (geométrica, Poisson, binomial negativa) con datos de recuento, dentro del marco GLM (solo 3 de las 8 distribuciones GLM se usan para datos de recuento, aunque la mayoría de lo que He leído centros alrededor de las distribuciones binomial negativa y de Poisson).
¿Cuándo usar GLM binomiales Poisson vs. geométricos vs. negativos para los datos de conteo?
Hasta ahora tengo la siguiente lógica: ¿Es contar datos? En caso afirmativo, ¿son diferentes la media y la varianza? En caso afirmativo, regresión binomial negativa. Si no, regresión de Poisson. ¿Hay cero inflación? En caso afirmativo, binomio negativo inflado cero o binomio negativo inflado cero.
Pregunta 1 Parece que no hay una indicación clara de qué usar cuándo. ¿Hay algo para informar esa decisión? Por lo que entiendo, una vez que cambias a ZIP, la varianza media es igual de supuesta y se relaja, por lo que es bastante similar a NB nuevamente.
Pregunta 2 ¿Dónde encaja la familia geométrica en esto o qué tipo de preguntas debo hacer a los datos al decidir si usar una familia geométrica en mi regresión?
Pregunta 3 Veo personas intercambiando las distribuciones binomial negativa y de Poisson todo el tiempo pero no geométricas, así que supongo que hay algo claramente diferente sobre cuándo usarlo. Si es así, ¿qué es?
PD: He hecho un diagrama (probablemente simplificado, de los comentarios) ( editable ) de mi comprensión actual si la gente quisiera comentarlo / modificarlo para su discusión.