Tengo un conjunto de datos que contiene la cantidad de acciones realizadas por individuos en el transcurso de 7 días. La acción específica no debería ser relevante para esta pregunta. Aquí hay algunas estadísticas descriptivas para el conjunto de datos:
Aquí hay un histograma de los datos:
A juzgar por la fuente de los datos, pensé que encajaría en una distribución de Poisson. Sin embargo, la varianza media ≠, y el histograma está fuertemente ponderado a la izquierda. Además, ejecuté la goodfit
prueba en R y obtuve:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
El método de máxima verosimilitud también arrojó un valor p = 0. Suponiendo que la hipótesis nula es: los datos coinciden con una distribución de Poisson (la documentación no especifica esto), entonces la goodfit
prueba dice que debemos rechazar la hipótesis nula, por lo tanto, los datos no coincidir con una distribución de Poisson.
¿Es correcto ese análisis? Si es así, ¿qué distribución cree que se ajustará a estos datos?
Mi objetivo final es comparar el número medio de acciones entre 2 muestras para ver si las medias son diferentes; ¿es necesario verificar la distribución? Entiendo que las pruebas típicas (pruebas z-, t-, ) no funcionan para las distribuciones de Poisson. ¿Qué prueba debo usar si los datos están efectivamente distribuidos por Poisson?