Cuando trabajamos con muchas variables de entrada, a menudo nos preocupa la multicolinealidad . Existen varias medidas de multicolinealidad que se utilizan para detectar, pensar y / o comunicar multicolinealidad. Algunas recomendaciones comunes son:
- El múltiple para una variable particular
- La tolerancia, , para una variable particular
- El factor de inflación de varianza, , para una variable particular
El número de condición de la matriz de diseño en su conjunto:
(Hay algunas otras opciones discutidas en el artículo de Wikipedia, y aquí en SO en el contexto de R.)
El hecho de que los primeros tres sean una función perfecta el uno del otro sugiere que la única ventaja neta posible entre ellos sería psicológica. Por otro lado, los primeros tres le permiten examinar las variables individualmente, lo que podría ser una ventaja, pero he oído que el método del número de condición se considera el mejor.
- ¿Es esto cierto? ¿Lo mejor para qué?
- ¿Es el número de condición una función perfecta de 's? (Creo que lo sería)
- ¿La gente encuentra que uno de ellos es más fácil de explicar? (Nunca he tratado de explicar estos números fuera de clase, solo doy una descripción suelta y cualitativa de multicolinealidad).