¿Comparando coeficientes de regresión logística entre modelos?


11

Desarrollé un modelo logit para aplicar a seis conjuntos diferentes de datos de sección transversal. Lo que intento descubrir es si hay cambios en el efecto sustantivo de una variable independiente (IV) dada en la variable dependiente (DV) que controla otras explicaciones en diferentes momentos y a lo largo del tiempo.

Mis preguntas son:

  • ¿Cómo evalúo el aumento / disminución del tamaño en la asociación entre IV y DV?
  • ¿Puedo simplemente mirar las diferentes magnitudes (tamaños) de los coeficientes a través de los modelos o necesito pasar por algún otro proceso?
  • Si necesito hacer algo más, ¿qué es y qué puedo hacer / cómo lo hago en SPSS?

    Además, dentro de un solo modelo,

  • ¿Puedo comparar el tamaño relativo de variables independientes basadas en puntajes no estandarizados si todos están codificados 0-1 o necesito convertirlos en puntajes estandarizados?
  • ¿Hay problemas relacionados con los puntajes estandarizados?

2
Este artículo puede ser de interés, dx.doi.org/10.1093/esr/jcp006 , ¡aparentemente comparar efectos entre modelos logísticos es considerablemente más complicado que en el caso de OLS!
Andy W

Respuestas:


13

Me centraré principalmente en tus primeras tres preguntas. Las respuestas cortas son: (1) necesita comparar el efecto de la IV en el DV para cada período de tiempo, pero (2) solo comparar las magnitudes puede llevar a conclusiones erróneas, y (3) hay muchas formas de hacerlo, pero No hay consenso sobre cuál es la correcta.

A continuación describo por qué no puede simplemente comparar las magnitudes de coeficientes y señalar algunas soluciones que se han pensado hasta ahora.

Según Allison (1999), a diferencia de los MCO, los coeficientes de regresión logística se ven afectados por la heterogeneidad no observada, incluso cuando dicha heterogeneidad no está relacionada con la variable de interés.

Cuando encajas en una regresión logística como:

ln(11pi)=β0+β1x1i

y1y

y=α0+α1x1i+σε

ε

αβ

βj=αjσj=1,...,J.

σβσ

Esto se debe a que las comparaciones pueden arrojar conclusiones incorrectas si la variación no observada difiere entre grupos, países o períodos. Ambas comparaciones usando diferentes modelos y usando términos de interacción dentro del mismo modelo sufren de este problema. Además de logit, esto también se aplica a sus primos probit, clog-log, cauchit y, por extensión, a modelos de riesgo de tiempo discreto estimados usando estas funciones de enlace. Los modelos logit ordenados también se ven afectados por él.

Williams (2009) argumenta que la solución es modelar la variación no observada a través de un modelo de elección heterogéneo (también conocido como un modelo de escala de ubicación), y proporciona un complemento Stata solicitado oglm para eso (Williams 2010). En R, los modelos de elección heterogénea se pueden adaptar a la hetglm()función del glmxpaquete, que está disponible a través de CRAN. Ambos programas son muy fáciles de usar. Por último, Williams (2009) menciona la PLUMrutina de SPSS para adaptar estos modelos, pero nunca la he usado y no puedo comentar lo fácil que es usarla.

Sin embargo, hay al menos un documento de trabajo que muestra que las comparaciones que usan modelos de elección heterogéneos pueden estar aún más sesgadas si la ecuación de varianza está mal especificada o si hay un error de medición.

Mood (2010) enumera otras soluciones que no implican modelar la varianza, pero utilizan comparaciones de cambios de probabilidad pronosticados.

Aparentemente es un problema que no está resuelto y a menudo veo documentos en conferencias de mi campo (Sociología) con diferentes soluciones para ello. Le aconsejaría que observe lo que hace la gente en su campo y luego decida cómo lidiar con eso.

Referencias


Estoy tratando de implementar la solución Williams (2009) en R y parece que las nuevas versiones del paquete glmx ya no tienen la función hetprob (). ¿Solo quería comprobar si conoces alguna alternativa para esto?
AliCivil

1
No he usado glmx en mucho tiempo y no sabía que había cambiado. Ahora está disponible a través de CRAN, y la función utilizada para probit hereroskedastic se llama hetglm (), aparentemente. Actualizaré esta respuesta para reflejar esto más adelante (se trata de la hora de acostarse aquí). Espero que esto ayude por ahora.
Kenji

3

¿Hay cambios en los conjuntos de datos? ¡Puedo responder eso sin ver los datos! Si. Existen. ¿Qué tan grandes son? Eso es clave Para mí, la forma de ver es mirando. Tendrás odds ratios para cada variable independiente para cada conjunto de datos: ¿son diferentes en las formas en que las personas encontrarían interesantes? Ahora, es cierto que cada uno tendrá un error estándar y así sucesivamente, y probablemente haya formas de ver si son estadísticamente significativamente diferentes entre sí, pero ¿es realmente una pregunta interesante? Si es así, entonces una forma de probarlo fácilmente con el software sería combinar todos los estudios e incluir el "estudio" como otra variable independiente. Incluso podría probar las interacciones, si lo desea. Si desea hacer esto depende de sus preguntas sustantivas.

En cuanto a la comparación de variables dentro de un modelo, el principal problema con los puntajes estandarizados es que están estandarizados en su muestra particular. Por lo tanto, las estimaciones de los parámetros, etc., están en términos de desviaciones estándar de las variables en su muestra particular. Incluso si su muestra es realmente una muestra aleatoria de alguna población, tendrá desviaciones estándar (ligeramente) diferentes de otras muestras aleatorias. Esto hace que las cosas sean confusas.

El otro problema es qué significa incluso la cuestión del "tamaño relativo". Si sus IV son cosas que se entienden bien, puede comparar los OR a través de rangos que significan algo.


Que útil, gracias Peter. La razón por la que hice la primera pregunta es porque he visto exactamente eso: comparaciones de coeficientes entre modelos dentro de una muestra y comparaciones entre modelos de diferentes muestras, en documentos revisados. No sentí que fuera el enfoque correcto y, evidentemente, estoy en lo correcto. Con respecto a los detalles técnicos, ¿no puedo simplemente estimar un modelo en las seis muestras y un término de interacción entre el predictor clave que quiero comparar y una variable que especifica cada muestra (que representa un período de tiempo diferente)? ¿Es eso lo que estabas diciendo? ¿Necesito una variable para cada s
Ejs

Hola @ejs Debería codificar "muestra" de la misma manera que cualquier otra variable categórica: codificación ficticia o codificación de efectos o lo que sea.
Peter Flom - Restablece a Monica

En cuanto a las interacciones ... sí, pueden ser difíciles de interpretar. Me gusta un enfoque gráfico para mostrar lo que significan.
Peter Flom - Restablece a Monica

3

Guilherme está en el dinero aquí. Si bien las otras respuestas son útiles, tenga en cuenta que la regresión logística (y toda regresión no lineal como Poisson, para el caso) son fundamentalmente diferentes a la regresión lineal. Puede haber problemas serios con el factor de escala logit al ejecutar el mismo análisis en seis conjuntos de datos diferentes y luego ejecutar ese análisis en el conjunto de datos combinado. Los cambios en los coeficientes pueden no tener nada que ver con diferencias significativas (incluso si son estadísticamente significativas o sustancialmente importantes). Podrían tener todo que ver con la heterogeneidad no observada en las muestras. Absolutamente tienes que probar para eso. Muchos (si no la mayoría) de los investigadores en los campos de las ciencias sociales y políticas ignoran esto. Guilherme da los artículos fundamentales sobre esto que recomiendo que todos miren. Las sugerencias de Peters son prácticas, pero simplemente codificar una variable ficticia para la muestra de la que provienen los datos no abordará esta heterogeneidad en el factor de escala. Puede hacerlo en regresión lineal y la heterogeneidad no debería afectar sus coeficientes, pero aquí sí.

Otro aspecto del efecto de la heterogeneidad no observada exclusiva de la regresión lineal frente a logit es el efecto de diferentes regresores en cada conjunto de datos. Si no tiene las mismas variables, o probablemente si se miden de manera diferente, tiene una forma de sesgo de variable omitido. A diferencia de la regresión lineal, una variable ortogonal omitida a su regresor clave aún puede sesgar su estimación. Como dice Cramer:

β^β^

Cramer también señala que aunque las estimaciones de coeficientes están sesgadas hacia abajo cuando se omite una variable, las derivadas parciales no lo son. Esto es bastante complicado y debe leer el artículo para obtener una explicación más lúcida: el punto general es que no mire exclusivamente las probabilidades de registro o las razones de probabilidades. Considerar probabilidades predichas y derivados; vea el comando de márgenes en Stata para más detalles. JD Long tiene un artículo que entra en detalles aquí.

Finalmente, hay una serie de documentos que puede buscar en Google para analizar los términos de interacción en los modelos logit. Según tengo entendido, tome el coeficiente logit de una interacción como guía pero no definitivo, especialmente si prefiere ver los coeficientes como odds ratios exponenciados. Observar las probabilidades pronosticadas y el efecto marginal promedio es mejor (nuevamente, busque documentación en el comando de margen de Stata para logit, incluso si usa SPSS, esto aún será útil).

No estoy lo suficientemente familiarizado con SPSS para saber cómo ese paquete puede tratar estos problemas, pero diré esto: cuando entras en problemas estadísticos más profundos como este, es una indicación de que es hora de que pases a un paquete flexible y sofisticado como Stata o R.


+1 por recomendar efectos marginales y por recomendar mudarse a R.
Kenji

1

Otra herramienta que puede ser útil es el coeficiente de regresión estandarizado, o al menos una pseudo versión aproximada. Puede obtener una de esas versiones multiplicando el coeficiente obtenido por la desviación estándar del predictor. (Hay otras versiones y algunos debates sobre la mejor, por ejemplo, ver Menard 2002, Análisis de regresión logística aplicada ( Google books )). Esto le dará una manera de evaluar la fuerza del efecto en todos los estudios.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.