Me centraré principalmente en tus primeras tres preguntas. Las respuestas cortas son: (1) necesita comparar el efecto de la IV en el DV para cada período de tiempo, pero (2) solo comparar las magnitudes puede llevar a conclusiones erróneas, y (3) hay muchas formas de hacerlo, pero No hay consenso sobre cuál es la correcta.
A continuación describo por qué no puede simplemente comparar las magnitudes de coeficientes y señalar algunas soluciones que se han pensado hasta ahora.
Según Allison (1999), a diferencia de los MCO, los coeficientes de regresión logística se ven afectados por la heterogeneidad no observada, incluso cuando dicha heterogeneidad no está relacionada con la variable de interés.
Cuando encajas en una regresión logística como:
ln(11−pi)=β0+β1x1i
y∗1y∗
y∗=α0+α1x1i+σε
ε
αβ
βj=αjσj=1,...,J.
σβσ
Esto se debe a que las comparaciones pueden arrojar conclusiones incorrectas si la variación no observada difiere entre grupos, países o períodos. Ambas comparaciones usando diferentes modelos y usando términos de interacción dentro del mismo modelo sufren de este problema. Además de logit, esto también se aplica a sus primos probit, clog-log, cauchit y, por extensión, a modelos de riesgo de tiempo discreto estimados usando estas funciones de enlace. Los modelos logit ordenados también se ven afectados por él.
Williams (2009) argumenta que la solución es modelar la variación no observada a través de un modelo de elección heterogéneo (también conocido como un modelo de escala de ubicación), y proporciona un complemento Stata solicitado oglm
para eso (Williams 2010). En R, los modelos de elección heterogénea se pueden adaptar a la hetglm()
función del glmx
paquete, que está disponible a través de CRAN. Ambos programas son muy fáciles de usar. Por último, Williams (2009) menciona la PLUM
rutina de SPSS para adaptar estos modelos, pero nunca la he usado y no puedo comentar lo fácil que es usarla.
Sin embargo, hay al menos un documento de trabajo que muestra que las comparaciones que usan modelos de elección heterogéneos pueden estar aún más sesgadas si la ecuación de varianza está mal especificada o si hay un error de medición.
Mood (2010) enumera otras soluciones que no implican modelar la varianza, pero utilizan comparaciones de cambios de probabilidad pronosticados.
Aparentemente es un problema que no está resuelto y a menudo veo documentos en conferencias de mi campo (Sociología) con diferentes soluciones para ello. Le aconsejaría que observe lo que hace la gente en su campo y luego decida cómo lidiar con eso.
Referencias
- Allison, PD (1999). Comparación de los coeficientes Logit y Probit en todos los grupos. Sociological Methods & Research, 28 (2), 186–208.
- Mood, C. (2010). Regresión logística: por qué no podemos hacer lo que creemos que podemos hacer y qué podemos hacer al respecto. European Sociological Review, 26 (1), 67–82.
- Williams, R. (2009). Uso de modelos de elección heterogéneos para comparar los coeficientes Logit y Probit en todos los grupos. Sociological Methods & Research, 37 (4), 531–559.
- Williams, R. (2010). Adaptación de modelos de elección heterogéneos con oglm. The Stata Journal, 10 (4), 540-567.