Esta es una respuesta práctica más parcial, pero me funciona hacer algunos ejercicios antes de profundizar en la teoría .
Este enlace ats.ucla.edu es una referencia que podría ayudar a comenzar a comprender sobre la regresión logística multinomial (como señaló Bill), de una manera más práctica.
Presenta un código reproducible para comprender la función multinomdesde el nmetpaquete Ry también ofrece un resumen sobre la interpretación de las salidas.
Considera este código:
va = c('cat','dog','dog','goat','cat','goat','dog','dog')
# cat will be the outcome baseline
vb = c(1,2,1,2,1,2,1,2)
vc = c('blue','red','blue','red','red','blue','yellow','yellow')
# blue will be the vc predictor baseline
set.seed(12)
vd = round(rnorm(8),2)
data = data.frame(cbind(va,vb,vc,vd))
library(nnet)
fit <- multinom(va ~ as.numeric(vb) + vc + as.numeric(vd), data=data)
# weights: 18 (10 variable)
initial value 8.788898
iter 10 value 0.213098
iter 20 value 0.000278
final value 0.000070
converged
fit
Call:
multinom(formula = va ~ as.numeric(vb) + vc + as.numeric(vd),
data = data)
Coefficients:
(Intercept) as.numeric(vb) vcred vcyellow as.numeric(vd)
dog -1.044866 120.3495 -6.705314 77.41661 -21.97069
goat 47.493155 126.4840 49.856414 -41.46955 -47.72585
Residual Deviance: 0.0001656705
AIC: 20.00017
Así es como puede interpretar el modelo logístico multinomial ajustado lineal-log:
ln(P(va=cat)P(va=dog))ln(P(va=cat)P(va=goat))=b10+b11vb+b12(vc=red)+b13(vc=yellow)+b14vd =b20+b21vb+b22(vc=red)+b23(vc=yellow)+b24vd
Aquí hay un extracto sobre cómo se pueden interpretar los parámetros del modelo:
- Un aumento de una unidad en la variable vd se asocia con la disminución en las probabilidades de registro de ser "perro" frente a "gato" en la cantidad de 21.97069 ( ).b14
la misma lógica para la segunda línea pero, considerando "cabra" vs. "gato" con ( = -47.72585). b24
- Las probabilidades de registro de ser "perro" frente a "gato" aumentarán en 6.705314 si se pasa de vc = "azul" a vc = "rojo" ( ). b12
.....
Hay mucho más en el artículo, pero pensé que esta parte era el núcleo.
Referencia:
R Ejemplos de análisis de datos: regresión logística multinomial. UCLA: Grupo de Consultoría Estadística.
de http://www.ats.ucla.edu/stat/r/dae/mlogit.htm (consultado el 5 de noviembre de 2013).