Actualmente estoy ejecutando algunos modelos lineales de efectos mixtos.
Estoy usando el paquete "lme4" en R.
Mis modelos toman la forma:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
Antes de ejecutar mis modelos, verifiqué la posible multicolinealidad entre los predictores.
Hice esto por:
Hacer un marco de datos de los predictores
dummy_df <- data.frame(predictor1, predictor2)
Use la función "cor" para calcular la correlación de Pearson entre predictores.
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
Si "correl_dummy_df" era mayor que 0.80, entonces decidí que predictor1 y predictor2 estaban demasiado correlacionados y no estaban incluidos en mis modelos.
Al leer un poco, aparecerían formas más objetivas de verificar la multicolinealidad.
¿Alguien tiene algún consejo sobre esto?
El "Factor de inflación de varianza (VIF)" parece un método válido.
El VIF se puede calcular utilizando la función "corvif" en el paquete AED (no Cran). El paquete se puede encontrar en http://www.highstat.com/book2.htm . El paquete admite el siguiente libro:
Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA y Smith, GM 2009. Modelos y extensiones de efectos mixtos en ecología con R, 1ª edición. Springer, Nueva York.
Parece que una regla general es que si VIF es> 5, entonces la multicolinealidad es alta entre los predictores.
¿Usar VIF es más robusto que la simple correlación de Pearson?
Actualizar
Encontré un blog interesante en:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/
El blogger proporciona un código útil para calcular VIF para modelos del paquete lme4.
He probado el código y funciona muy bien. En mi análisis posterior, descubrí que la multicolinealidad no era un problema para mis modelos (todos los valores VIF <3). Esto fue interesante, dado que anteriormente había encontrado una alta correlación de Pearson entre algunos predictores.
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
paquete ha sido descontinuado ; en cambio, solosource("http://www.highstat.com/Book2/HighstatLibV6.R")
para lacorvif
función. (2) Espero proporcionar una respuesta real, pero (a) Creo que VIF tiene en cuenta la multicolinealidad (por ejemplo, puede tener tres predictores, ninguno de los cuales tiene fuertes correlaciones por pares, pero la combinación lineal de A y B está fuertemente correlacionada con C ) y (b) tengo fuertes reservas sobre la sabiduría de descartar términos colineales; ver Graham Ecology 2003, doi: 10.1890 / 02-3114