Coeficiente negativo en regresión logística ordenada

Supongamos que tenemos la respuesta ordinal $y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}$ y un conjunto de variables que creemos que explicará . Luego hacemos una regresión logística ordenada de (matriz de diseño) en (respuesta). $X:=[x_1,x_2,x_3]$ $y$ $X$ $y$

Suponga que el coeficiente estimado de , , en la regresión logística ordenada es . ¿Cómo interpreto el odds ratio (OR) de ? $x_1$ $\hat{\beta}_1$ $-0.5$ $e^{-0.5} = 0.607$

¿Debo decir "para un aumento de 1 unidad en , ceteris paribus, las probabilidades de observar son veces las probabilidades de observar , y para el mismo cambio en , las probabilidades de observar son veces las probabilidades de observar "? $x_1$ $\text{Good}$ $0.607$ $\text{Bad}\cup \text{Neutral}$ $x_1$ $\text{Neutral} \cup \text{Good}$ $0.607$ $\text{Bad}$

No puedo encontrar ningún ejemplo de interpretación de coeficientes negativos en mi libro de texto o en Google.

logit odds-ratio ordered-logit

— mdewey
fuente

Si, eso es correcto. Es casi idéntico a cómo interpreta los coeficientes positivos.

— Peter Flom - Restablece a Monica

NB: generalmente decimos "regresión en ", no al revés.

y

$y$

X

$X$

— gung - Restablecer Monica

Está en el camino correcto, pero siempre eche un vistazo a la documentación del software que está utilizando para ver qué modelo se ajusta realmente. Suponga una situación con una variable dependiente categórica con categorías ordenadas y predictores . $Y$ $1, \ldots, g, \ldots, k$ $X_{1}, \ldots, X_{j}, \ldots, X_{p}$

"In the wild", puede encontrar tres opciones equivalentes para escribir el modelo teórico de probabilidades proporcionales con diferentes significados de parámetros implícitos:

$\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} + \beta_{1} X_{1} + \dots + \beta_{p} X_{p} \quad(g = 1, \ldots, k-1)$
$\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} - (\beta_{1} X_{1} + \dots + \beta_{p} X_{p}) \quad(g = 1, \ldots, k-1)$
$\text{logit}(p(Y \geqslant g)) = \ln \frac{p(Y \geqslant g)}{p(Y < g)} = \beta_{0_g} + \beta_{1} X_{1} + \dots + \beta_{p} X_{p} \quad(g = 2, \ldots, k)$

(Los modelos 1 y 2 tienen la restricción de que en las regresiones logísticas binarias separadas , la no varía con , y , el modelo 3 tiene la misma restricción sobre el , y requiere que ) $k-1$ $\beta_{j}$ $g$ $\beta_{0_1} < \ldots < \beta_{0_g} < \ldots < \beta_{0_k-1}$ $\beta_{j}$ $\beta_{0_2} > \ldots > \beta_{0_g} > \ldots > \beta_{0_k}$

En el modelo 1, un positivo significa que un aumento en predictor se asocia con mayores probabilidades para un menor categoría en . $\beta_{j}$ $X_{j}$ $Y$
El modelo 1 es algo contradictorio, por lo tanto, el modelo 2 o 3 parece ser el preferido en el software. Aquí, a positivos significa que un aumento en predictor se asocia con mayores probabilidades para un mayor categoría en . $\beta_{j}$ $X_{j}$ $Y$
Los modelos 1 y 2 conducen a las mismas estimaciones para , pero sus estimaciones para tienen signos opuestos. $\beta_{0_g}$ $\beta_{j}$
Los modelos 2 y 3 conducen a las mismas estimaciones para , pero sus estimaciones para tienen signos opuestos. $\beta_{j}$ $\beta_{0_g}$

Suponiendo que su software usa el modelo 2 o 3, puede decir "con un aumento de 1 unidad en , ceteris paribus, las probabilidades pronosticadas de observar ' ' versus observar ' ' por un factor de . "y del mismo modo" con un aumento de 1 unidad en , ceteris paribus, los predichos probabilidades de observar ' ' vs. observando ' ' cambio en un factor de $X_1$ $Y = \text{Good}$ $Y = \text{Neutral OR Bad}$ $e^{\hat{\beta}_{1}} = 0.607$ $X_1$ $Y = \text{Good OR Neutral}$ $Y = \text{Bad}$ . "Tenga en cuenta que en el caso empírico, solo tenemos las probabilidades predichas, no las reales. $e^{\hat{\beta}_{1}} = 0.607$

Aquí hay algunas ilustraciones adicionales para el modelo 1 con categorías. Primero, la suposición de un modelo lineal para los logits acumulativos con probabilidades proporcionales. En segundo lugar, las probabilidades implícitas de observar en la mayoría de las categorías . Las probabilidades siguen funciones logísticas con la misma forma. $k = 4$ $g$ ingrese la descripción de la imagen aquí

Para las probabilidades de categoría en sí, el modelo representado implica las siguientes funciones ordenadas: ingrese la descripción de la imagen aquí

PD: Que yo sepa, el modelo 2 se usa en SPSS, así como en funciones R MASS::polr()y ordinal::clm(). El modelo 3 se usa en funciones R rms::lrm()y VGAM::vglm(). Desafortunadamente, no sé acerca de SAS y Stata.

— lince
fuente

Y

$Y$ glm(..., family=binomial)

¿Tiene una referencia que aborde la forma de expresar la especificación n. ° 2 en su lista de 3 alternativas?

@ Harokitty Se describe brevemente en el "Análisis de datos categóricos ordinarios " de Agresti, sección 3.2.2, p49, ecuación 3.8 . Alternativamente, en el "Análisis de datos categóricos" de Agresti, sección 9.4, p323, ecuación 9.12.

— caracal

Hola, lamento molestarte, ¿tienes una referencia para la tercera? Agresti no parece hablar de eso.

logit (Y > g)

$\text{logit}(Y > g)$

logit (Y ⩾ g)

$\text{logit}(Y \geqslant g)$