He estado trabajando para responder mi pregunta calculando manualmente las probabilidades y las razones de probabilidades:
Acceptance blue red Grand Total
0 158 102 260
1 112 177 289
Total 270 279 549
Entonces, el Odds Ratio de ingresar a la escuela de Red over Blue es:
O d d s A c c e p t I f R e dO d d s A c c c e p t I f B l u e=177/ /102112/ /158= 1.73530,7089= 2.448
Y este es el Backgroundredregreso de:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))
Odds_and_OR 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
(Intercept)112 / 158 = 0,7089
Si en cambio, ejecuto:
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))
Odds 2.5 % 97.5 %
Backgroundblue 0.7088608 0.5553459 0.9017961
Backgroundred 1.7352941 1.3632702 2.2206569
Los retornos son precisamente las probabilidades de ser 'azul': Backgroundblue(0.7089) y las probabilidades de ser aceptado como 'rojo': Backgroundred(1.7353). No hay odds ratio allí. Por lo tanto, no se espera que los dos valores de retorno sean recíprocos.
Finalmente, ¿cómo leer los resultados si hay 3 factores en el regresor categórico?
Mismo cálculo manual versus [R]:
Creé un conjunto de datos ficticios diferente con la misma premisa, pero esta vez había tres orígenes étnicos: "rojo", "azul" y "naranja", y ejecuté la misma secuencia:
Primero, la tabla de contingencia:
Acceptance blue orange red Total
0 86 65 130 281
1 64 42 162 268
Total 150 107 292 549
Y calculé las probabilidades de entrar para cada grupo étnico:
- Las probabilidades aceptan si rojo = 1.246154;
- Las probabilidades aceptan si el azul = 0.744186;
- Las probabilidades aceptan si Naranja = 0.646154
Además de las diferentes Odds Ratios :
- O rojo v azul = 1.674519;
- O rojo v naranja = 1.928571;
- O azul v rojo = 0.597186;
- O azul v naranja = 1.151717;
- O naranja v rojo = 0.518519; y
- O naranja v azul = 0.868269
Y procedió con la regresión logística ahora rutinaria seguida de exponenciación de coeficientes:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))
ODDS 2.5 % 97.5 %
(Intercept) 0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred 1.6745192 1.1271430 2.497853
Ceder las probabilidades de obtener "blues" como (Intercept), y las Odds Ratios de Orange versus Blue in Backgroundorange, y el OR de Red v Blue in Backgroundred.
Por otro lado, la regresión sin intercepción predeciblemente devolvió solo las tres probabilidades independientes :
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))
ODDS 2.5 % 97.5 %
Backgroundblue 0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred 1.2461538 0.9900426 1.5715814
Rque llama explícitamente los coeficientes (a través de la funcióncoef) está llamando a la "razón de posibilidades" en su salida. Eso sugiere que es posible que desee revisar la distinción entre los dos.