Con suerte, esta es una pregunta que alguien aquí puede responder por mí sobre la naturaleza de la descomposición de sumas de cuadrados a partir de un modelo de efectos mixtos lmer
(del paquete lme4 R).
En primer lugar, debo decir que soy consciente de la controversia con el uso de este enfoque, y en la práctica sería más probable que use un LRT de arranque para comparar modelos (como lo sugiere Faraway, 2006). Sin embargo, estoy desconcertado sobre cómo replicar los resultados, y por mi propia cordura, pensé en preguntar aquí.
Básicamente, me estoy acostumbrando al uso de modelos de efectos mixtos que se ajustan al lme4
paquete. Sé que puede usar el anova()
comando para dar un resumen de la prueba secuencial de los efectos fijos en el modelo. Hasta donde yo sé, esto es a lo que Faraway (2006) se refiere como el enfoque de "cuadrados medios esperados". Lo que quiero saber es cómo se calculan las sumas de cuadrados.
Sé que podría tomar los valores estimados de un modelo en particular (usando coef()
), asumir que son fijos y luego hacer pruebas usando las sumas de cuadrados de los residuos del modelo con y sin los factores de interés. Esto está bien para un modelo que contiene un único factor dentro del sujeto. Sin embargo, al implementar un diseño de parcela dividida, el valor de las sumas de cuadrados que obtengo es equivalente al valor producido por R usando aov()
una Error()
designación apropiada . Sin embargo, esto no es lo mismo que las sumas de cuadrados producidas por el anova()
comando en el objeto modelo, a pesar de que las proporciones F son las mismas.
Por supuesto, esto tiene mucho sentido ya que no hay necesidad de Error()
estratos en un modelo mixto. Sin embargo, esto debe significar que las sumas de cuadrados se penalizan de alguna manera en un modelo mixto para proporcionar proporciones F apropiadas. ¿Cómo se logra esto? ¿Y cómo el modelo de alguna manera corrige la suma de cuadrados entre parcelas pero no corrige la suma de cuadrados dentro de la parcela? Evidentemente, esto es algo necesario para un ANOVA de parcela dividida clásico que se logró al designar diferentes valores de error para los diferentes efectos, entonces, ¿cómo lo permite un modelo de efectos mixtos?
Básicamente, quiero poder replicar los resultados del anova()
comando aplicado a un objeto de modelo más pequeño para verificar los resultados y mi comprensión, sin embargo, actualmente puedo lograr esto para un diseño normal dentro del tema, pero no para la división. diseño de la trama y parece que no puedo descubrir por qué este es el caso.
Como ejemplo:
library(faraway)
library(lme4)
data(irrigation)
anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation))
Analysis of Variance Table
Df Sum Sq Mean Sq F value
irrigation 3 1.6605 0.5535 0.3882
variety 1 2.2500 2.2500 1.5782
summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data = irrigation))
Error: field
Df Sum Sq Mean Sq F value Pr(>F)
irrigation 3 40.19 13.40 0.388 0.769
Residuals 4 138.03 34.51
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
variety 1 2.25 2.250 1.578 0.249
Residuals 7 9.98 1.426
Como se puede ver sobre todo, las relaciones F están de acuerdo. Las sumas de cuadrados para la variedad también están de acuerdo. Sin embargo, las sumas de cuadrados para riego no están de acuerdo, sin embargo, parece que la salida de lmer está escalada. Entonces, ¿qué hace realmente el comando anova ()?
mixed()
deafex
la cual las ofertas lo que quiere (a travésmethod = "PB"
). Y como obviamente ha realizado algunas pruebas con datos de juguetes, definitivamente sería útil si puede mostrar esas equivalencias con los datos y el código (por lo tanto, no +1).