¿Cuándo usar el modelo de efectos mixtos?


11

Los modelos de efectos lineales mixtos son extensiones de modelos de regresión lineal para datos que se recopilan y resumen en grupos. Las ventajas clave son que los coeficientes pueden variar con respecto a una o más variables de grupo.

Sin embargo, estoy luchando con cuándo usar el modelo de efectos mixtos. Elaboraré mis preguntas utilizando un ejemplo de juguete con casos extremos.

Supongamos que queremos modelar la altura y el peso de los animales y utilizamos especies como variables de agrupación.

  • Si diferentes grupos / especies son realmente diferentes. Digamos un perro y un elefante. Creo que no tiene sentido usar un modelo de efectos mixtos, deberíamos construir un modelo para cada grupo.

  • Si diferentes grupos / especies son realmente similares. Digamos una perra y un perro macho. Creo que queremos usar el género como una variable categórica en el modelo.

Entonces, supongo que deberíamos usar el modelo de efectos mixtos en los casos intermedios. Digamos que el grupo es gato, perro, conejo, son animales de tamaño similar pero diferentes.

¿Hay algún argumento formal para sugerir cuándo usar el modelo de efectos mixtos, es decir, cómo dibujar líneas entre

  1. Construyendo modelos para cada grupo
  2. Modelo de efectos mixtos
  3. Usar grupo como variable categórica en regresión

Mi intento: el método 1 es el "modelo más complejo" / menor grado de libertad y el método 3 es el "modelo más simple" / mayor grado de libertad. Y el modelo de efectos mixtos está en el medio. Podemos considerar la cantidad de datos y la complejidad de los datos que tenemos para seleccionar el modelo correcto de acuerdo con el equilibrio de variación de Bais.


55
Esto se discute en muchos hilos en este foro. ¿Has buscado alguna? Tenga en cuenta que su opción con "variable categórica" ​​es lo que se llama un "efecto fijo" (de la variable de agrupación), mientras que lo que quiere decir con "usar modelo mixto" es usar un "efecto aleatorio". Entonces, lo que está preguntando es cuándo usar el efecto fijo y cuándo usar el efecto aleatorio. Hay varias opiniones sobre esta pregunta, y puedes encontrar muchas discusiones aquí en CV. Podría publicar algunos enlaces más tarde.
ameba

Además, la diferencia entre "construir modelos separados" y "usar variables categóricas" no me resulta clara. activity ~ condition + species + condition*species- esto se usa speciescomo variable categórica, pero esto es totalmente equivalente a una regresión separada activity ~ conditionpara cada especie por separado.
ameba

2
Consulte este hilo: stats.stackexchange.com/questions/120964/… , no responde su pregunta directamente, pero proporciona una discusión que está estrechamente relacionada con su pregunta.
Tim

3
Bueno, ¿has leído stats.stackexchange.com/a/151800/28666 , para empezar?
ameba

2
"Si un grupo / especie diferente es realmente diferente. Digamos un perro y un elefante. Creo que no tiene sentido usar un modelo de efectos mixtos, deberíamos construir un modelo para cada grupo". Esto solo es cierto si espera que los efectos de todas las demás características difieran según la especie. Esto es, en la mayoría de las situaciones, una suposición demasiado liberal.
Matthew Drury

Respuestas:


8

Me temo que podría tener la respuesta matizada y quizás insatisfactoria de que es una elección subjetiva del investigador o analista de datos. Como se menciona en otra parte de este hilo, no es suficiente simplemente decir que los datos tienen una "estructura anidada". Sin embargo, para ser justos, esta es la cantidad de libros que describen cuándo usar modelos multinivel. Por ejemplo, acabo de sacar el libro Análisis multinivel de Joop Hox de mi estantería, lo que da esta definición:

Un problema multinivel concierne a una población con una estructura jerárquica.

Incluso en un libro de texto bastante bueno, la definición inicial parece ser circular. Creo que esto se debe en parte a la subjetividad de determinar cuándo usar qué tipo de modelo (incluido un modelo multinivel).

Otro libro, Modelos lineales mixtos de West, Welch y Galecki dice que estos modelos son para:

variables de resultado en las que los residuos se distribuyen normalmente pero pueden no ser independientes o tener una varianza constante. Los diseños de estudios que conducen a conjuntos de datos que pueden analizarse adecuadamente utilizando LMM incluyen (1) estudios con datos agrupados, como estudiantes en aulas, o diseños experimentales con bloques aleatorios, como lotes de materia prima para un proceso industrial, y (2) estudios longitudinales o de medidas repetidas, en los que los sujetos se miden repetidamente a lo largo del tiempo o en diferentes condiciones.

El modelado multinivel de Finch, Bolin y Kelley en R también habla de violar la suposición de iid y los residuos correlacionados:

De particular importancia en el contexto del modelado multinivel es el supuesto [en regresión estándar] de términos de error distribuidos independientemente para las observaciones individuales dentro de una muestra. Esta suposición esencialmente significa que no hay relaciones entre los individuos en la muestra para la variable dependiente una vez que se tienen en cuenta las variables independientes en el análisis.

Creo que un modelo multinivel tiene sentido cuando hay razones para creer que las observaciones no son necesariamente independientes entre sí. Cualquier "grupo" que explique esta no independencia puede ser modelado.

Un ejemplo obvio serían los niños en las aulas: todos están interactuando entre ellos, lo que puede hacer que sus puntajes en las pruebas no sean independientes. ¿Qué sucede si una clase tiene a alguien que hace una pregunta que lleva a que el material esté cubierto en esa clase que no está cubierto en otras clases? ¿Qué pasa si el maestro está más despierto para algunas clases que para otras? En este caso, habría cierta falta de independencia de los datos; en palabras multinivel, podríamos esperar que alguna variación en la variable dependiente se deba al clúster (es decir, la clase).

Creo que su ejemplo de un perro versus un elefante depende de las variables de interés independientes y dependientes. Por ejemplo, digamos que estamos preguntando si hay un efecto de la cafeína en el nivel de actividad. Los animales de todo el zoológico se asignan al azar para obtener una bebida con cafeína o una bebida de control.

Si somos un investigador interesado en la cafeína, podríamos especificar un modelo multinivel, porque realmente nos importa el efecto de la cafeína. Este modelo se especificaría como:

activity ~ condition + (1+condition|species)

Esto es particularmente útil si hay una gran cantidad de especies sobre las que estamos probando esta hipótesis. Sin embargo, un investigador podría estar interesado en los efectos de la cafeína específicos de la especie. En ese caso, podrían especificar especies como un efecto fijo:

activity ~ condition + species + condition*species

Obviamente, esto es un problema si hay, por ejemplo, 30 especies, creando un diseño difícil de manejar de 2 x 30. Sin embargo, puede ser bastante creativo con la forma en que uno modela estas relaciones.

Por ejemplo, algunos investigadores están abogando por un uso aún más amplio del modelado multinivel. Gelman, Hill y Yajima (2012) argumentan que el modelado multinivel podría usarse como una corrección para comparaciones múltiples, incluso en investigaciones experimentales donde la estructura de los datos no es obviamente de naturaleza jerárquica:

Los problemas más difíciles surgen al modelar comparaciones múltiples que tienen más estructura. Por ejemplo, supongamos que tenemos cinco medidas de resultado, tres variedades de tratamientos y subgrupos clasificados por dos sexos y cuatro grupos raciales. No quisiéramos modelar esta estructura 2 × 3 × 4 × 5 como 120 grupos intercambiables. Incluso en estas situaciones más complejas, creemos que el modelado multinivel debería y eventualmente tomará el lugar de los procedimientos clásicos de comparaciones múltiples.

Los problemas pueden modelarse de varias maneras, y en casos ambiguos, múltiples enfoques pueden parecer atractivos. Creo que nuestro trabajo es elegir un enfoque razonable e informado y hacerlo de manera transparente.


5

Por supuesto, podría construir un modelo para cada grupo diferente, no hay nada de malo en eso. Sin embargo, necesitaría un tamaño de muestra más grande y necesitaría administrar múltiples modelos.

Al usar el modelo mixto, agrupa (y comparte) los datos juntos y, por lo tanto, requiere un tamaño de muestra más pequeño.

Al hacerlo, estamos compartiendo fuerza estadística. La idea aquí es que algo que podemos inferir bien en un grupo de datos puede ayudarnos con algo que no podemos inferir bien en otro.

Los modelos mixtos también evitan que los grupos sobremuestreados dominen inferencia injustamente.

Mi punto es que si desea modelar la estructura jerárquica latern subyacente, debe agregar efectos aleatorios a su modelo. De lo contrario, si no le importa la interpretación de su modelo, no la usará.

https://www.dropbox.com/s/rzi2rsou6h817zz/Datascience%20Presentation.pdf?dl=0

da una discusión relevante. El autor discutió por qué no quería ejecutar modelos de regresión separados.

ingrese la descripción de la imagen aquí


4

En los modelos de efectos mixtos, agrega términos aleatorios (error) a su modelo, por lo que "mezcla" efectos fijos y aleatorios. Por lo tanto, otro enfoque para considerar cuándo usar modelos de efectos mixtos, podría ser observar qué es un "efecto aleatorio". Por lo tanto, además de las respuestas dadas anteriormente, también encuentro la distinción entre los términos efectos "fijos" y "aleatorios" de Bates (2010) instructivo, sección 1.1 (especialmente en la página 2).

Los parámetros asociados con los niveles particulares de una covariable a veces se denominan "efectos" de los niveles. Si el conjunto de niveles posibles de la covariable es fijo y reproducible , modelaremos la covariable utilizando parámetros de efectos fijos. Si los niveles que observamos representan una muestra aleatoria del conjunto de todos los niveles posibles , incorporamos efectos aleatorios en el modelo. Hay dos cosas a tener en cuenta sobre esta distinción entre parámetros de efectos fijos y efectos aleatorios. Primero, los nombres son engañosos porque la distinción entre fijo y aleatorio es más una propiedad de los niveles de la covariable categórica que una propiedad de los efectos asociados con ellos.

Esta definición a menudo se aplica a alguna estructura jerárquica, como países o aulas, porque siempre se tiene una muestra "aleatoria" de países o aulas: no se han recopilado datos de todos los países o aulas posibles.

Sin embargo, el sexo es fijo (o al menos se lo trata como fijo). Si tiene personas de sexo masculino o femenino, no quedan otros niveles de sexo (puede haber algunas excepciones de género, pero esto se ignora principalmente).

O diga nivel educativo: si pregunta si las personas son de educación inferior, media o superior, no quedan niveles, por lo que no ha tomado una muestra "aleatoria" de todos los niveles educativos posibles (por lo tanto, este es un efecto fijo).


2
+1 ¿Por qué el voto negativo? Es una cita de un estadístico muy respetado sobre modelos de efectos aleatorios; el siguiente comentario es bastante directo y bien definido ...
usεr11852

3

Se utilizan modelos mixtos cuando se pueden hacer suposiciones razonables, basadas en el diseño del estudio, sobre la naturaleza de la correlación entre observaciones e inferencia que se desea a nivel individual o efectos condicionales . Los modelos mixtos permiten especificaciones de efectos aleatorios, que son una representación conveniente de las estructuras de correlación que surgen naturalmente en la recopilación de datos.

El tipo más común de modelo mixto es un modelo de intercepciones aleatorias que estima una distribución latente de constantes comunes que tienen una distribución normal de varianza finita media de 0 dentro de grupos de individuos identificados en el conjunto de datos. Este enfoque representa potencialmente cientos de factores de confusión comunes a grupos de observaciones, o grupos, pero que varían entre grupos.

Un segundo tipo común de modelo mixto es un modelo de pendientes aleatorias que, similar al modelo de interceptaciones aleatorias, estima una distribución latente de interacciones de predictores de tiempo que nuevamente proviene de una distribución normal de varianza finita de media 0 dentro de un grupo de estudio o grupos de observaciones medidas prospectivamente o de manera longitudinal.

Estos resultados son más o menos similares a los resultados obtenidos al usar mínimos cuadrados generalizados y el algoritmo EM para estimar iterativamente los parámetros del modelo y la covarianza entre estas observaciones dependientes (o más precisamente, sus residuos). Los mínimos cuadrados ponderados son más eficientes que los mínimos cuadrados cuando se conoce la covarianza entre observaciones. Si bien la covarianza rara vez se conoce, se puede suponer que toma una estructura particular y se estima de forma iterativa. El modelo de intercepciones aleatorias proporciona inferencias y probabilidades similares a los mínimos cuadrados ponderados que tienen una estructura de correlación intercambiable donde siY 1 , Y 2 c o r ( Y t , Y s ) = ρ | t - s | Y t , Y s t , scor(Y1,Y2)=ρY1,Y2están en el mismo clúster y 0 en caso contrario. El modelo de pendientes aleatorias proporciona inferencias y probabilidades similares a los mínimos cuadrados ponderados que tienen una estructura de correlación autorregresiva 1 donde si son observaciones en la misma muestra en diferentes momentos 0 de lo contrario. Los resultados no son idénticos, porque la intercepción aleatoria obliga a las observaciones dentro de los grupos a asociarse positivamente, lo que casi siempre es una suposición razonable.cor(Yt,Ys)=ρ|ts|Yt,Yst,s

El nivel individual o los efectos condicionales pueden contrastarse con el nivel de la población o los efectos marginales. Los efectos marginales representan el efecto en una población de una intervención o detección. Como ejemplo, una intervención para aumentar el cumplimiento en la rehabilitación del abuso de sustancias puede analizar la asistencia durante 3 meses en un panel de pacientes ingresados ​​por diversas afecciones. La duración del uso puede variar entre los pacientes y predecir fuertemente el cumplimiento del taller con un uso más prolongado de participantes que tengan mayores tendencias adictivas y evitación. Un análisis a nivel individual puede revelar que el estudio es efectivo a pesar del hecho de que los participantes con una adicción más prolongada no asistieron antes de recibir la intervención y continuaron sin asistir después de recibir la intervención.

Los efectos marginales tienen una inferencia menos precisa debido a que se ignora la homogeneidad entre grupos en el tiempo o el espacio. Se pueden estimar con ecuaciones de estimación generalizadas o marginando los modelos mixtos.


2
+1, ¡ojalá pueda aceptar 2 respuestas !. mi comentario a la respuesta de @ Mark también se aplica a su respuesta. que me ayudaste a entender cómo definimos la "observación en grupos"
Haitao Du

2
@ hxd1011 Proviene estrictamente de una declaración de diseño de estudio. Cualquier diseño con muestras estratificadas o medidas repetidas tendrá datos no independientes. Este no es un caso para pruebas estadísticas. Informar o al menos inspeccionar los efectos aleatorios puede ayudar a comprender el alcance de la correlación, un ICC es un ejemplo de tal medida.
AdamO

0

Los efectos mixtos deben usarse cuando los datos tienen una estructura anidada o jerárquica. Esto realmente viola el supuesto de independencia de las mediciones, porque todas las mediciones dentro del mismo grupo / nivel están correlacionadas. En caso de

"Si un grupo / especie diferente es realmente similar. Digamos un perro hembra y un perro macho. Creo que podemos querer usar el género como una variable categórica en el modelo".

el género sería un factor variable y de efecto fijo, mientras que la variabilidad del tamaño de los perros dentro del género es un efecto aleatorio. Mi modelo seria

response ~ sex + (1|size), data=data

Intuitivamente, los conejos, perros y cates deben modelarse por separado ya que los tamaños de perros y gatos no están correlacionados, sin embargo, el tamaño de dos perros es una especie de variabilidad "dentro de la especie".


Personalmente, creo que el término "estructura jerárquica o anidada" es demasiado general y me resulta difícil definir límites.
Haitao Du

Quizás estás en lo cierto. Supongo que luego se usan LMM cuando se viola la suposición de IID debido a algún tipo de agrupación presente en los datos.
marianess
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.