Antes de hacer esta pregunta, busqué en nuestro sitio y encontré muchas preguntas similares (como aquí , aquí y aquí ). Pero creo que esas preguntas relacionadas no fueron bien respondidas o discutidas, por lo que me gustaría plantear esta pregunta nuevamente. Siento que debería haber una gran cantidad de público que desea que este tipo de preguntas se expliquen más claramente.
Para mis preguntas, primero considere el modelo lineal de efectos mixtos,
Supongamos que el único factor de efecto fijo es una variable categórica Tratamiento , con 3 niveles diferentes. Y el único factor de efecto aleatorio es la variable Asunto . Dicho esto, tenemos un modelo de efectos mixtos con efecto de tratamiento fijo y efecto de sujeto aleatorio.
Mis preguntas son así:
- ¿Existe el supuesto de homogeneidad de varianza en la configuración del modelo mixto lineal, análogo a los modelos de regresión lineal tradicionales? Si es así, ¿qué significa el supuesto específicamente en el contexto del problema del modelo mixto lineal mencionado anteriormente? ¿Cuáles son otros supuestos importantes que deben evaluarse?
Mis pensamientos: SI. las suposiciones (quiero decir, media de error cero e igual varianza) siguen siendo de aquí: . En la configuración tradicional del modelo de regresión lineal, podemos decir que la suposición es que "la varianza de los errores (o simplemente la varianza de la variable dependiente) es constante en los 3 niveles de tratamiento". Pero no sé cómo podemos explicar esta suposición bajo la configuración de modelo mixto. ¿Deberíamos decir "las variaciones son constantes en 3 niveles de tratamientos, condicionamiento en los sujetos? ¿O no?"
El documento en línea de SAS sobre los diagnósticos de residuos e influencia trajo dos residuos diferentes, es decir, los residuos marginales , y los residuos condicionales , Mi pregunta es, ¿para qué se usan los dos residuos? ¿Cómo podríamos usarlos para verificar el supuesto de homogeneidad? Para mí, solo los residuos marginales se pueden usar para abordar el problema de la homogeneidad, ya que corresponde al del modelo. ¿Mi comprensión aquí es correcta?
¿Hay alguna prueba propuesta para probar el supuesto de homogeneidad bajo el modelo lineal mixto? @Kam señaló la prueba del nivel anteriormente, ¿sería esta la forma correcta? Si no, ¿cuáles son las instrucciones? Creo que después de ajustar el modelo mixto, podemos obtener los residuos, y tal vez podamos hacer algunas pruebas (como la prueba de bondad de ajuste), pero no estoy seguro de cómo sería.
También noté que hay tres tipos de residuos de Proc Mixed en SAS, a saber, el residuo Raw , el residual Studentizado y el residual de Pearson . Puedo entender las diferencias entre ellos en términos de fórmulas. Pero para mí parecen ser muy similares cuando se trata de trazados de datos reales. Entonces, ¿cómo deberían usarse en la práctica? ¿Hay situaciones en las que se prefiere un tipo a los otros?
Para un ejemplo de datos reales, los siguientes dos gráficos residuales son de Proc Mixed en SAS. ¿Cómo podrían abordar la suposición de la homogeneidad de las variaciones?
[Sé que tengo un par de preguntas aquí. Si pudiera darme alguna de sus ideas para cualquier pregunta, eso es genial. No es necesario abordarlos todos si no puede. Realmente deseo discutir sobre ellos para obtener una comprensión completa. ¡Gracias!]
Aquí están las parcelas residuales marginales (en bruto).
Aquí están los gráficos residuales condicionales (en bruto).