Si solo está poniendo ese predictor solitario en el modelo, entonces la razón de posibilidades entre el predictor y la respuesta será exactamente igual al coeficiente de regresión exponencial . No creo que una derivación de este resultado esté presente en el sitio, así que aprovecharé esta oportunidad para proporcionarlo.
Considere un resultado binario y un predictor binario único :XYX
X=1X=0Y=1p11p01Y=0p10p00
Entonces, una forma de calcular la razón de posibilidades entre e esY iXiYi
OR=p11p00p01p10
Por definición de probabilidad condicional, . En la relación, las probabilidades marginales que involucran la cancelan y puede reescribir la razón de probabilidades en términos de las probabilidades condicionales de :X Y | Xpij=P(Y=i|X=j)⋅P(X=j)XY|X
OR=P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
En la regresión logística, modela estas probabilidades directamente:
log(P(Yi=1|Xi)P(Yi=0|Xi))=β0+β1Xi
Entonces podemos calcular estas probabilidades condicionales directamente del modelo. La primera relación en la expresión para anterior es:OR
P(Yi=1|Xi=1)P(Yi=0|Xi=1)=(11+e−(β0+β1))(e−(β0+β1)1+e−(β0+β1))=1e−(β0+β1)=e(β0+β1)
y el segundo es:
P(Yi=0|Xi=0)P(Yi=1|Xi=0)=(e−β01+e−β0)(11+e−β0)=e−β0
conectando esto de nuevo a la fórmula, tenemos , que es el resultado.OR=e(β0+β1)⋅e−β0=eβ1
Nota: Cuando tenga otros predictores, , en el modelo, el coeficiente de regresión exponencial (usando una derivación similar) es en realidadZ1,...,Zp
P(Y=1|X=1,Z1,...,Zp)P(Y=0|X=1,Z1,...,Zp)⋅P(Y=0|X=0,Z1,...,Zp)P(Y=1|X=0,Z1,...,Zp)
por lo tanto, la razón de probabilidades está condicionada a los valores de los otros predictores en el modelo y, en general, no es igual a
P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
Por lo tanto, no es sorprendente que esté observando una discrepancia entre el coeficiente exponencial y la razón de probabilidades observada.
Nota 2: deduje una relación entre el verdadero y la verdadera razón de posibilidades, pero tenga en cuenta que la misma relación se mantiene para las cantidades de muestra ya que la regresión logística ajustada con un solo predictor binario reproducirá exactamente las entradas de un dos por dos mesa. Es decir, los medios ajustados coinciden exactamente con los medios de muestra, como con cualquier GLM. Entonces, toda la lógica utilizada anteriormente se aplica con los valores verdaderos reemplazados por cantidades de muestra. β