He explorado muchos sitios de ayuda y todavía estoy confundido acerca de cómo especificar términos anidados más complicados en un modelo mixto también. También estoy confundido en cuanto al uso de :
y /
y |
en la especificación de interacciones y anidando con factores aleatorios usando lmer()
en el lme4
paquete de R
.
A los fines de esta pregunta, supongamos que he retratado con precisión mis datos con este modelo estadístico estándar: es fijo, y son al azar está (implícitamente) anidado dentro .
station
tow
day
Tow
station
En otras palabras, espero que mi modelo incluya Station (i, fixed), Tow (j, random, implícitamente anidado dentro de Station), Day (k, random) e interacción entre Tow y Day, y la interacción entre Day y estación. He consultado con un estadístico para crear mi modelo y en este momento creo que es representativo de mis datos, pero también agregaré una descripción de mis datos para aquellos que estén interesados en la parte inferior de mi publicación para no saturarlos.
Hasta ahora, lo que he podido reconstruir es lo siguiente en lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
¿Representa esto con precisión mi modelo estadístico? ¿Alguna sugerencia sobre cómo mejorar mi código si no se lee correctamente?
He en negrita los términos específicos que tengo dificultades para especificar en mi fórmula anterior
# 1 remolque anidado dentro de la estación cuando el remolque es aleatorio y la estación está fija
Estoy confundido, sin embargo, sobre la diferenciación entre los términos anidados y de interacción que son aleatorios usando :
y /
. En mi ejemplo anterior, tengo (1|station:tow)
en el que espero leer remolques anidados dentro de la estación. He leído comentarios contradictorios en varios sitios, ya sea que deba usarlos :
o no /
en este (1|...)
formato aleatorio lmer
.
# 2 La interacción entre la estación y el día cuando la estación es fija y el día es aleatorio
, (1|station:day)
pero esta vez espero que lea la interacción entre la estación y el día. Parece que podría usar station * day para tener en cuenta los efectos individuales de station y day, así como su interacción (en lugar de incluir cada uno de los tres términos por separado como lo hago anteriormente), pero no veo cómo especificar esto cuando uno es fijo y el otro es aleatorio. Haría station*(1|day)
eso?
# 3 La interacción entre el remolque y el día (ambos aleatorios) cuando el remolque está anidado en la estación (fijo)
Luego, finalmente, tengo el (1|tow:day)
que espero lee la interacción de tow
y day
, pero me pregunto si necesito especificar nuevamente que el remolque está anidado (implícitamente) en la estación?
Soy nuevo en el modelado estadístico y en ambos, R
y lmer
agradezco enormemente el problema de las explicaciones exhaustivas en cualquier respuesta a mis preguntas, si es posible.
Más detalles sobre mis datos: pregunto si las concentraciones de plancton varían en un frente físico en el océano cercano a la costa. Tengo tres estaciones, en la costa, dentro y fuera de este frente. La estación es así fija. En cada estación, tomo tres remolques de plancton replicados (de los cuales clasifico, cuento y obtengo una concentración en términos de # de errores por metro en cubos de agua). El remolque es aleatorio: en tres remolques espero explicar la variabilidad general del plancton en esa estación en particular. El remolque está intrínsecamente anidado en la estación, ya que cada remolque no tiene una identificación única (123,123,123 es la identificación de los remolques en cada estación). Luego hice esto en varios días independientes con un nuevo frente que se había formado. ¿Creo que puedo pensar en Day como un factor de bloqueo? El día es aleatorio ya que repetir esto en varios días de frente independientes está tratando de capturar la variabilidad del día a día y ser representativo de todos los días en los que este frente está presente. Quiero saber acerca de los términos de interacción para ver si Tows cambia en variabilidad de un día a otro y si las estaciones siempre producen datos similares o depende del día?
Nuevamente, gracias por su tiempo y ayuda, ¡lo aprecio!
R
sintaxis, la OMI, es lo suficientemente estadístico (es decir, comprender cómo se relaciona el modelo especificado con la anidación y las interacciones, etc.) para estar en el tema para CV.
lmer()
sintaxis, ha especificado un modelo en el que hay un efecto fijo de station
y cuatro intercepciones aleatorias, compartidas por individuos con la misma (1) combinación de station
y tow
, (2) valor de Day
, (3) combinación de station
y day
y ( 4) combinación de tow
y day
, respectivamente. ¿Es esto lo que pretendías? No estoy seguro porque, como lo indicó @BabekP, no está claro cómo ha escrito la formulación de su modelo. Has escrito nombres de variables, no parámetros. Normalmente, en un modelo como este, las combinaciones de variables son capturadas por los subíndices.