Diferencia entre modelos lineales generalizados y modelos lineales mixtos generalizados


34

Me pregunto cuáles son las diferencias entre GLM mixtos y no mezclados. Por ejemplo, en SPSS, el menú desplegable permite a los usuarios ajustar:

  • analyze-> generalized linear models-> generalized linear models Y
  • analyze-> mixed models-> generalized linear

¿Tratan los valores perdidos de manera diferente?

Mi variable dependiente es binaria y tengo varias variables independientes categóricas y continuas.


Respuestas:


62

El advenimiento de los modelos lineales generalizados nos ha permitido construir modelos de datos de tipo regresión cuando la distribución de la variable de respuesta no es normal, por ejemplo, cuando su DV es binario. (Si desea saber un poco más sobre GLiM, escribí una respuesta bastante extensa aquí , que puede ser útil aunque el contexto difiera). Sin embargo, un GLiM, por ejemplo, un modelo de regresión logística, supone que sus datos son independientes . Por ejemplo, imagine un estudio que analiza si un niño ha desarrollado asma. Cada niño aporta unolos datos apuntan al estudio: tienen asma o no. Sin embargo, a veces los datos no son independientes. Considere otro estudio que analiza si un niño tiene un resfriado en varios puntos durante el año escolar. En este caso, cada niño aporta muchos puntos de datos. Hubo un tiempo en que un niño tenía un resfriado, luego no, y aún más tarde podría tener otro resfriado. Estos datos no son independientes porque provienen del mismo niño. Para analizar adecuadamente estos datos, debemos tener en cuenta de alguna manera esta no independencia. Hay dos formas: una es utilizar las ecuaciones de estimación generalizadas (que no menciona, por lo que omitiremos). La otra forma es utilizar un modelo mixto lineal generalizado.. Los GLiMM pueden dar cuenta de la no independencia al agregar efectos aleatorios (como señala @MichaelChernick). Por lo tanto, la respuesta es que su segunda opción es para datos repetidos de medidas no normales (o de otra manera no independientes). (I debería mencionar, de acuerdo con comentario de @ Macro, que general- ized lineal modelos mixtos incluyen modelos lineales como un caso especial y por lo tanto puede ser utilizado con datos distribuidos normalmente. Sin embargo, en el uso típico el término connota de datos no normales).

Actualización: (El OP también ha preguntado sobre GEE, por lo que escribiré un poco sobre cómo se relacionan los tres).

Aquí hay una descripción básica:

  • un GLiM típico (usaré la regresión logística como el caso prototípico) le permite modelar una respuesta binaria independiente en función de covariables
  • un GLMM le permite modelar una respuesta binaria no independiente (o agrupada) condicional en los atributos de cada grupo individual en función de covariables
  • el GEE le permite modelar la respuesta media de la población de datos binarios no independientes en función de covariables

Como tiene varias pruebas por participante, sus datos no son independientes; Como bien ha notado, "los ensayos dentro de un participante probablemente sean más similares que en todo el grupo". Por lo tanto, debe usar GLMM o GEE.

El problema, entonces, es cómo elegir si GLMM o GEE serían más apropiados para su situación. La respuesta a esta pregunta depende del tema de su investigación, específicamente, el objetivo de las inferencias que espera hacer. Como dije anteriormente, con un GLMM, las versiones beta le informan sobre el efecto de un cambio de una unidad en sus covariables en un participante en particular, dadas sus características individuales. Por otro lado, con el GEE, las versiones beta le informan sobre el efecto de un cambio de una unidad en sus covariables sobre el promedio de las respuestas de toda la población en cuestión. Esta es una distinción difícil de entender, especialmente porque no existe tal distinción con los modelos lineales (en cuyo caso los dos son lo mismo).

Una forma de tratar de comprender esto es imaginar un promedio sobre su población en ambos lados del signo igual en su modelo. Por ejemplo, este podría ser un modelo: donde: Hay un parámetro que gobierna la distribución de la respuesta ( , la probabilidad, con datos binarios) en el lado izquierdo para cada participante. En el lado derecho, hay coeficientes para el efecto de la covariable [s] y el nivel de línea base cuando la covariable [s] es igual a 0. Lo primero que debe notar es que la intercepción real para cualquier individuo específico no es , sino más bien logit ( p ) = ln ( p

logit(pi)=β0+β1X1+bi
pβ0(β0+bi)biβ0β1pilogitβ1
logit(p)=ln(p1p),     &      bN(0,σb2)
p β0(β0+bi) . ¿Y qué? Si suponemos que los '(el efecto aleatorio) se distribuyen normalmente con una media de 0 (como lo hemos hecho), ciertamente podemos promediar estos sin dificultad (sería simplemente ). Además, en este caso no tenemos un efecto aleatorio correspondiente para las pendientes y, por lo tanto, su promedio es solo . Entonces, el promedio de las intersecciones más el promedio de las pendientes debe ser igual a la transformación logit del promedio de las de la izquierda, ¿no es así? Lamentablemente no . El problema es que entre esos dos está el , que no es linealbiβ0β1pilogittransformación. (Si la transformación fuera lineal, serían equivalentes, por lo que este problema no ocurre para los modelos lineales.) La siguiente gráfica deja esto claro: ingrese la descripción de la imagen aquí
Imagine que esta gráfica representa el proceso de generación de datos subyacente para la probabilidad de que una clase pequeña de los estudiantes podrán aprobar un examen sobre alguna materia con un número determinado de horas de instrucción sobre ese tema. Cada una de las curvas grises representa la probabilidad de aprobar el examen con diferentes cantidades de instrucción para uno de los estudiantes. La curva en negrita es el promedio de toda la clase. En este caso, el efecto de una hora adicional de enseñanza condicional en los atributos del alumno esβ1- lo mismo para cada estudiante (es decir, no hay una pendiente aleatoria). Sin embargo, tenga en cuenta que la capacidad de referencia de los estudiantes difiere entre ellos, probablemente debido a diferencias en cosas como el coeficiente intelectual (es decir, hay una intercepción aleatoria). Sin embargo, la probabilidad promedio para la clase en su conjunto sigue un perfil diferente al de los estudiantes. El resultado sorprendentemente contrario a la intuición es este: una hora adicional de instrucción puede tener un efecto considerable en la probabilidad de que cada estudiante pase la prueba, pero tiene un efecto relativamente pequeño en la proporción total probable de estudiantes que aprueban . Esto se debe a que algunos estudiantes ya pueden haber tenido una gran posibilidad de aprobar, mientras que otros todavía tienen pocas posibilidades.

La pregunta de si debe usar un GLMM o el GEE es la pregunta de cuáles de estas funciones desea estimar. Si desea saber acerca de la probabilidad de que un alumno fallezca (si, por ejemplo, usted era el alumno o el padre del alumno), desea utilizar un GLMM. Por otro lado, si desea saber sobre el efecto en la población (si, por ejemplo, usted fuera el maestro o el director), querría usar el GEE.

Para otra discusión, más matemáticamente detallada, de este material, vea esta respuesta de @Macro.


2
Esta es una buena respuesta, pero creo que, especialmente en la última oración, casi parece indicar que solo usa GLM o GLMM para datos no normales que probablemente no fueron intencionados, ya que los modelos lineales (mixtos) gaussianos comunes también se incluyen la categoría GL (M) M.
Macro

@Macro, tienes razón, siempre lo olvido. Edité la respuesta para aclarar esto. Avísame si crees que necesita más.
gung - Restablece a Monica

También revisé las ecuaciones de estimación generalizadas. ¿Es correcto que, al igual que con GLiM, GEE asume que mis datos son independientes? Tengo múltiples ensayos por participante. Es probable que los ensayos dentro de un participante sean más similares que en todo el grupo.
user9203

@gung, aunque GEE puede producir coeficientes "promediados por la población", si quisiera estimar el efecto de tratamiento promedio (ATE) en la escala de probabilidad en la población real, para un regresor binario de interés, ¿no tendría que tomar un enfoque específico del tema? La forma de calcular el ATE, que yo sepa, es estimar la probabilidad pronosticada para cada persona con y sin tratamiento y luego promediar esas diferencias. ¿No requiere esto un método de regresión que pueda generar probabilidades pronosticadas para cada persona (a pesar de que luego se promedian)?
Yakkanomica

1
@Yakkanomica, si eso es lo que quieres, seguro.
gung - Restablece a Monica

6

La clave es la introducción de efectos aleatorios. El enlace de Gung lo menciona. Pero creo que debería haber sido mencionado directamente. Esa es la principal diferencia.


+1, tienes razón. Debería haber sido más claro al respecto. Edité mi respuesta para incluir este punto.
gung - Restablece a Monica

Cada vez que agrego un efecto aleatorio, como una intercepción aleatoria al modelo, recibo un mensaje de error. Creo que no tengo suficientes puntos de datos para agregar efectos aleatorios. ¿Podría ser ese el caso? mensaje de error: glmm: la matriz de Hesse final no es positiva definida, aunque se cumplen todos los criterios de convergencia. El procedimiento continúa a pesar de esta advertencia. Los resultados posteriores producidos se basan en la última iteración. La validez del ajuste del modelo es incierta.
user9203

3

Le sugiero que también examine las respuestas de una pregunta que hice hace algún tiempo:

Modelo lineal general versus modelo lineal generalizado (¿con una función de enlace de identidad?)


55
No creo que eso realmente responda a la pregunta, que trata sobre las capacidades de SPSS para ejecutar modelos GLM y de efectos mixtos, y cómo maneja los valores faltantes. ¿Se pretendía que esto fuera un comentario? De lo contrario, aclarar.
chl

Lo sentimos, la publicación de apertura parecía tener dos "preguntas". 1. Me pregunto qué ... y 2. ¿Tratan los valores perdidos de manera diferente? Estaba tratando de ayudar con la primera pregunta.
Behacad

1
Lo suficientemente justo. Sin más explicaciones, sigo pensando que esto encajaría mejor como comentario al OP.
chl
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.