Me encontré exactamente con la misma pregunta e intenté abrirme camino. Vea mi respuesta detallada a continuación.
En primer lugar, encontré 4 opciones que producen valores VIF similares en R:
• corvif
comando del paquete AED,
• vif
comando del paquete del automóvil,
• vif
comando del paquete rms,
• vif
comando del paquete DAAG.
El uso de estos comandos en un conjunto de predictores que no incluyen factores / variables categóricas o términos polinomiales es sencillo. Los tres comandos producen la misma salida numérica aunque el corvif
comando del paquete AED etiqueta los resultados como GVIF.
Sin embargo, normalmente, GVIF solo entra en juego para factores y variables polinómicas. Las variables que requieren más de 1 coeficiente y, por lo tanto, más de 1 grado de libertad, generalmente se evalúan utilizando el GVIF. Para términos de un coeficiente, VIF es igual a GVIF.
Por lo tanto, puede aplicar reglas generales estándar sobre si la colinealidad puede ser un problema, como un umbral de 3, 5 o 10. Sin embargo, se debe aplicar (debe) cierta precaución (ver: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).
En el caso de términos de coeficientes múltiples, como por ejemplo predictores categóricos, los 4 paquetes producen diferentes resultados. Los vif
comandos de los paquetes rms y DAAG producen valores VIF, mientras que los otros dos producen valores GVIF.
Veamos primero los valores VIF de los paquetes rms y DAAG:
TNAP ICE RegB RegC RegD RegE
1.994 2.195 3.074 3.435 2.907 2.680
TNAP e ICE son predictores continuos y Reg es una variable categórica presentada por los maniquíes RegB a RegE. En este caso, RegA es la línea de base. Todos los valores de VIF son bastante moderados y generalmente no hay nada de qué preocuparse. El problema con este resultado es que se ve afectado por la línea de base de la variable categórica. Para asegurarse de no tener un valor VIF por encima de un nivel aceptable, sería necesario rehacer este análisis para cada nivel de la variable categórica que sea la línea de base. En este caso cinco veces.
Aplicando el corvif
comando del paquete AED o el vif
comando del paquete del automóvil, se producen los valores GVIF:
| GVIF | Df | GVIF^(1/2Df) |
TNAP | 1.993964 | 1 | 1.412078 |
ICE | 2.195035 | 1 | 1.481565 |
Reg | 55.511089 | 5 | 1.494301 |
El GVIF se calcula para conjuntos de regresores relacionados, como un conjunto de regresores ficticios. Para las dos variables continuas TNAP e ICE, esto es lo mismo que los valores VIF anteriores. Para la variable categórica Reg, ahora obtenemos un valor GVIF muy alto, aunque los valores VIF para los niveles individuales de la variable categórica fueron todos moderados (como se muestra arriba).
G VyoF( 1 / ( 2 × D f) )G VyoF( 1 / ( 2 × D f) )El valor de la variable categórica es una medida similar para la reducción en la precisión de la estimación de los coeficientes debido a la colinealidad (aunque no esté listo para citar, también consulte http://socserv2.socsci.mcmaster.ca/jfox/papers/linear- models-problems.pdf ).
G VyoF( 1 / ( 2 × D f) )G VyoF( 1 / ( 2 × D f) )
G VyoF( 1 / ( 2 ×D f) )G VyoF( 1 / ( 2 × D f) )G VyoF2 ( 1 / ( 2 × D f) )< 2