Está en el camino correcto, pero siempre eche un vistazo a la documentación del software que está utilizando para ver qué modelo se ajusta realmente. Suponga una situación con una variable dependiente categórica con categorías ordenadas 1 , ... , g , ... , k y predictores X 1 , ... , X j , ... , X p .Y1,…,g,…,kX1,…,Xj,…,Xp
"In the wild", puede encontrar tres opciones equivalentes para escribir el modelo teórico de probabilidades proporcionales con diferentes significados de parámetros implícitos:
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g+β1X1+⋯+βpXp(g=1,…,k−1)
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g−(β1X1+⋯+βpXp)(g=1,…,k−1)
- logit ( p ( Y⩾ g) ) = lnp ( Y⩾ g)p ( Y< g)= β0 0sol+ β1X1+⋯+βpXp(g=2,…,k)
(Los modelos 1 y 2 tienen la restricción de que en las regresiones logísticas binarias separadas , la β j no varía con g , y β 0 1 < … < β 0 g < … < β 0 k - 1 , el modelo 3 tiene la misma restricción sobre el β j , y requiere que β 0 2 > ... > β 0 g > ... > β 0 k )k−1βjgβ01<…<β0g<…<β0k−1βjβ02>…>β0g>…>β0k
- En el modelo 1, un positivo significa que un aumento en predictor X j se asocia con mayores probabilidades para un menor categoría en Y .βjXjY
- El modelo 1 es algo contradictorio, por lo tanto, el modelo 2 o 3 parece ser el preferido en el software. Aquí, a positivos significa que un aumento en predictor X j se asocia con mayores probabilidades para un mayor categoría en Y .βjXjY
- Los modelos 1 y 2 conducen a las mismas estimaciones para , pero sus estimaciones para β j tienen signos opuestos.β0gβj
- Los modelos 2 y 3 conducen a las mismas estimaciones para , pero sus estimaciones para β 0 g tienen signos opuestos.βjβ0g
Suponiendo que su software usa el modelo 2 o 3, puede decir "con un aumento de 1 unidad en , ceteris paribus, las probabilidades pronosticadas de observar ' Y = Bueno ' versus observar ' Y = Neutral O Malo ' por un factor de e β 1 = 0,607 . "y del mismo modo" con un aumento de 1 unidad en X 1 , ceteris paribus, los predichos probabilidades de observar ' y = bueno o neutral ' vs. observando ' y = inadecuado ' cambio en un factor de e βX1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Bad. "Tenga en cuenta que en el caso empírico, solo tenemos las probabilidades predichas, no las reales.eβ^1=0.607
Aquí hay algunas ilustraciones adicionales para el modelo 1 con categorías. Primero, la suposición de un modelo lineal para los logits acumulativos con probabilidades proporcionales. En segundo lugar, las probabilidades implícitas de observar en la mayoría de las categorías g . Las probabilidades siguen funciones logísticas con la misma forma.
k=4g
Para las probabilidades de categoría en sí, el modelo representado implica las siguientes funciones ordenadas:
PD: Que yo sepa, el modelo 2 se usa en SPSS, así como en funciones R MASS::polr()
y ordinal::clm()
. El modelo 3 se usa en funciones R rms::lrm()
y VGAM::vglm()
. Desafortunadamente, no sé acerca de SAS y Stata.