Interpretación de resultados promedio de modelos en R

11

Estoy tratando de entender y saber qué informar de mi análisis de algunos datos usando el promedio de modelos en R.

Estoy usando el siguiente script para analizar el efecto del método de medición sobre una variable dada: Aquí está el conjunto de datos: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Modelo a montar:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

dragar modelo completo

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Obtenga información resumida de todos los modelos para obtener estimaciones de parámetros

summary(model.avg(d))

Sé que todos los modelos pueden promediarse (promedio de modelo completo) o solo un subconjunto de ellos (promedio condicional). Ahora, me gustaría saber: cuándo es mejor usar un promedio total o condicional para hacer inferencias. ¿Qué debo informar de todo esto para un artículo científico? ¿Qué significa exactamente el valor Z y la p asociada para una situación promedio de modelo?

Para que sea más fácil visualizar mis preguntas. Aquí está la tabla de resultados,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

r model-averaging

— Agus Camacho
fuente

5

Ver Grueber et al. 2011, "Inferencia multimodelo en ecología y evolución: desafíos y soluciones" Evolutionary Biology 24: 699-711.

Realmente depende de los objetivos en cuanto a si desea utilizar datos completos o condicionales. En mi campo usaríamos criterios, como AICC para determinar qué modelos son más compatibles, luego los usaríamos como su subconjunto condicional. Esta información sería luego reportada. Por ejemplo, sus primeros cuatro modelos están todos dentro de 2 unidades AIC entre sí, por lo que todos se incluirían en su subconjunto. Los otros están por ahí (mayor AIC), por lo que incluir información de ellos realmente reduciría la calidad de sus estimaciones beta.

— AUDeer
fuente

2

Sin embargo, incluso en su ejemplo sugerido, habrá algunos términos que aparecerán en quizás dos de los cuatro "mejores" modelos. ¿Toma una media de esos dos valores de coeficiente, o de los dos valores y dos valores cero para los dos modelos donde no aparecen?

— user2390246

5

Creo que la premisa sobre la diferencia entre cuáles son exactamente los promedios completos y condicionales es incorrecta. Uno es un promedio que incluye ceros (completo) y uno no incluye ceros (condicional). del archivo de ayuda para el comando model.avg ():

Nota

El promedio del 'subconjunto' (o 'condicional') solo promedia los modelos donde aparece el parámetro. Una alternativa, el promedio 'completo' supone que se incluye una variable en cada modelo, pero en algunos modelos el coeficiente correspondiente (y su respectiva varianza) se establece en cero. A diferencia del 'promedio de subconjunto', no tiene una tendencia a desviar el valor de cero. El promedio 'completo' es un tipo de estimador de contracción y para las variables con una relación débil con la respuesta son más pequeñas que los estimadores 'subconjuntos'.

Si solo desea usar un subconjunto de modelos (basado en delta AIC, por ejemplo), use el argumento de subconjunto en model.avg (). Aún obtendrá estimaciones condicionales y completas, siempre que a algunos de los modelos incluidos les falten algunas variables que otros tienen.

— Joe Sapp
fuente

Si. Estoy de acuerdo. Esa es la interpretación adecuada.

— ecologista1234