Supongamos que ajusto una regresión binomial y obtengo las estimaciones puntuales y la matriz de varianza-covarianza de los coeficientes de regresión. Eso me permitirá obtener un IC para la proporción esperada de éxitos en un experimento futuro, , pero necesito un IC para la proporción observada. Se han publicado algunas respuestas relacionadas, incluida la simulación (supongamos que no quiero hacer eso) y un enlace a Krishnamoorthya et al (que no responde a mi pregunta).
Mi razonamiento es el siguiente: si usamos solo el modelo Binomial, nos vemos obligados a suponer que se muestrea de la distribución Normal (con el IC de Wald correspondiente) y, por lo tanto, es imposible obtener CI para la proporción observada en forma cerrada. Si suponemos que se muestrea a partir de la distribución beta, entonces las cosas son mucho más fáciles porque la cuenta de éxitos seguirá a la distribución beta-binomial. Tendremos que suponer que no hay incertidumbre en los parámetros beta estimados, y .
Hay tres preguntas:
1) Teórico: ¿está bien usar solo las estimaciones puntuales de los parámetros beta? Sé que para construir un IC para la observación futura en regresión lineal múltiple
hacen esa varianza de término de error de wrt, . Supongo (corríjame si me equivoco) que la justificación es que en la práctica se estima con una precisión mucho mayor que los coeficientes de regresión y no ganaremos mucho al tratar de incorporar la incertidumbre de . ¿Se aplica una justificación similar a los parámetros beta estimados, y ?
2) ¿Qué paquete es mejor (R: gamlss-bb, betareg, aod ?; También tengo acceso a SAS).
3) Dados los parámetros beta estimados, ¿existe un atajo (aproximado) para obtener los cuantiles (2.5%, 97.5%) para el conteo de éxitos futuros o, mejor aún, para la proporción de éxitos futuros bajo la distribución Beta-Binomial.