¿Qué interpretación tienen los parámetros de un modelo lineal generalizado con codificación de efectos?


9
library(lme4)
    out <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.sum"))

summary(out)
Fixed effects:
            Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.32337    0.22129 -10.499  < 2e-16 ***
period1      0.92498    0.18330   5.046 4.51e-07 ***
period2     -0.06698    0.22845  -0.293    0.769
period3     -0.20326    0.24193  -0.840    0.401

Nunca estuve en una situación en la que necesitaba ajustar un modelo lineal generalizado con codificación de efectos ( contr.sumpara Rusuarios). ¿Puedo aplicar la misma interpretación que en el caso del modelo lineal? En un modelo lineal normal de la intersección sería la gran media y la s (parámetros para , , y los efectos, es decir, cómo los niveles de factor se desvían de la gran media.βperiod1period2period3period4 = (Intercept) - period1 - period2 - period3

Así es como creo que va la interpretación análoga para los modelos lineales generalizados. (Expondré todos los parámetros y, por lo tanto, transformaré el log-odds (-ratios) en odds (-ratios).) La intercepción sería la probabilidad general de éxito frente a fracaso ( pegando aquí a la terminología binomial clásica) y las s las log-odds-ratios . Y obtenemos las probabilidades para, por ejemplo, agregando y luego : . ¿Es el realmente las probabilidades generales / medias y el sexp((Intercept))βperiod1(Intercept)+period1exp((Intercept)+period1)(Intercept)βodds-ratios ?

Respuestas:


3

Bajo la codificación de efectos, la intersección en el resumen de la tabla de resumen (out) es el logit promedio (log-odds o el log of odds ratio) en los cuatro períodos en su caso, y cada uno de los otros efectos es la diferencia logit del período correspondiente en relación con el logit promedio.

Puede verificar fácilmente su interpretación comparando sus resultados actuales con un método de codificación diferente, como la codificación ficticia en sus datos:

out2 <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.treatment"))

summary(out2)

1
Yo diría que la intersección no es una razón de probabilidades sino más bien las probabilidades promedio y solo los coeficientes ( 's) son razones de probabilidades . El le da las probabilidades promedio (después de exponer) y cuando agrega la relación de probabilidades de registro de, por ejemplo, a las probabilidades de registro de y exponga esta suma luego tienes las probabilidades de . Creo que es importante mantener separadas las razones de probabilidades y las probabilidades . La primera es una relación entre las probabilidades, las últimas son las probabilidades de éxito frente a fracaso (en un modelo binomial).β(Intercept)period1(Intercept)period1
lord.garbage

Acaricie su comentario, edité mi respuesta un poco. Mira si está mejor ahora.
bluepole
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.