Estoy interesado en estimar una razón de riesgo ajustada, análoga a cómo se estima una razón de probabilidad ajustada usando regresión logística. Parte de la literatura (p. Ej., Esto ) indica que usar la regresión de Poisson con los errores estándar de Huber-White es una forma basada en el modelo para hacer esto.
No he encontrado literatura sobre cómo el ajuste por covariables continuas afecta esto. La siguiente simulación simple demuestra que este problema no es tan sencillo:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
En este caso, la verdadera razón de riesgo es 2, que se recupera de manera confiable cuando el efecto covariable es pequeño. Pero, cuando el efecto covariable es grande, esto se distorsiona. Supongo que esto surge porque el efecto covariable puede empujar hacia arriba contra el límite superior (1) y esto contamina la estimación.
He buscado pero no he encontrado ninguna literatura sobre el ajuste por covariables continuas en la estimación de la razón de riesgo ajustada. Soy consciente de las siguientes publicaciones en este sitio:
- Regresión de Poisson para estimar el riesgo relativo de resultados binarios.
- Regresión de Poisson para datos binarios.
pero no responden mi pregunta ¿Hay algún documento sobre esto? ¿Hay alguna precaución conocida que deba ejercerse?