Supongamos que tengo alguna variable de respuesta que se midió a partir del hermano en la familia . Además, se recopilaron algunos datos de comportamiento al mismo tiempo de cada sujeto. Estoy tratando de analizar la situación con el siguiente modelo lineal de efectos mixtos:
donde y α 1 son la intersección fija y la pendiente respectivamente, δ 1 i es la pendiente aleatoria y ε i j es el residual.
Los supuestos para los efectos aleatorios y residual ε i j son (suponiendo que solo haya dos hermanos dentro de cada familia)
donde es un parámetro de varianza desconocido y la estructura de varianza-covarianza R es una matriz simétrica de forma 2 x 2
eso modela la correlación entre los dos hermanos.
¿Es este un modelo apropiado para tal estudio de hermanos?
Los datos son un poco complicados. Entre las 50 familias, cerca del 90% de ellas son gemelas dicigóticas (DZ). Para el resto de familias,
- dos tienen un solo hermano;
- dos tienen un par DZ más un hermano; y
- dos tienen un par DZ más dos hermanos adicionales.
Creo que
lme
el paquete Rnlme
puede manejar fácilmente (1) con situaciones faltantes o desequilibradas. Mi problema es, ¿cómo lidiar con (2) y (3)? Una posibilidad que se me ocurre es dividir cada una de esas cuatro familias en (2) y (3) en dos para que cada subfamilia tenga uno o dos hermanos para que el modelo anterior pueda aplicarse. Esta bien? Otra opción sería simplemente tirar los datos de uno o dos hermanos adicionales en (2) y (3), lo que parece ser un desperdicio. ¿Algún mejor enfoque?Parece que
lme
permite fijar los valores de en la matriz de varianza-covarianza residual R , por ejemplo, r 2 12 = 0.5. ¿Tiene sentido imponer la estructura de correlación, o debería simplemente estimarla con base en los datos?
lme