Esto parece muy elemental, pero siempre me atoro en este punto ...
La mayoría de los datos con los que trato no son normales, y la mayoría de los análisis se basan en una estructura GLM. Para mi análisis actual, tengo una variable de respuesta que es "velocidad de marcha" (metros / minuto). ¡Es fácil para mí identificar que no puedo usar OLS, pero tengo una gran incertidumbre al decidir qué familia (Gamma, Weibull, etc.) es apropiada!
Uso Stata y miro diagnósticos como residuos y heterocedasticidad, residuos versus valores ajustados, etc.
Soy consciente de que los datos de recuento pueden tomar la forma de una tasa (p. Ej., Tasas de incidencia) y han utilizado gamma (el análogo a los modelos binomiales negativos discretos sobredispersados), pero me gustaría que una "pistola humeante" dijera SÍ, TIENE EL DERECHO FAMILIA. ¿Es la observación de los residuos estandarizados versus los valores ajustados la única y mejor manera de hacer esto? También me gustaría usar un modelo mixto para dar cuenta de cierta jerarquía en los datos, pero primero necesito resolver qué familia describe mejor mi variable de respuesta.
Cualquier ayuda apreciada. Lenguaje Stata especialmente apreciado!