Preguntas etiquetadas con multicollinearity

Situación cuando existe una fuerte relación lineal entre las variables predictoras, de modo que su matriz de correlación se vuelve (casi) singular. Esta "mala condición" hace que sea difícil determinar el papel único que desempeña cada uno de los predictores: surgen problemas de estimación y aumentan los errores estándar. Los predictores correlacionados bivariablemente muy altos son un ejemplo de multicolinealidad.

9
¿Existe una explicación intuitiva de por qué la multicolinealidad es un problema en la regresión lineal?
La wiki discute los problemas que surgen cuando la multicolinealidad es un problema en la regresión lineal. El problema básico es que los resultados multicolineales en estimaciones de parámetros inestables hacen que sea muy difícil evaluar el efecto de las variables independientes en las variables dependientes. Entiendo las razones técnicas …


1
¿Qué correlación hace que una matriz sea singular y cuáles son las implicaciones de singularidad o casi singularidad?
Estoy haciendo algunos cálculos en diferentes matrices (principalmente en regresión logística) y comúnmente aparece el error "Matrix is ​​singular", donde tengo que volver y eliminar las variables correlacionadas. Mi pregunta aquí es, ¿qué consideraría una matriz "altamente" correlacionada? ¿Existe un valor umbral de correlación para representar esta palabra? Como si …

3
¿Cuál es el efecto de tener predictores correlacionados en un modelo de regresión múltiple?
Aprendí en mi clase de modelos lineales que si dos predictores están correlacionados y ambos están incluidos en un modelo, uno será insignificante. Por ejemplo, suponga que el tamaño de una casa y el número de dormitorios están correlacionados. Al predecir el costo de una casa utilizando estos dos predictores, …

6
¿Por qué no se verifica la multicolinealidad en las estadísticas modernas / aprendizaje automático?
En las estadísticas tradicionales, al construir un modelo, verificamos la multicolinealidad utilizando métodos como las estimaciones del factor de inflación de varianza (VIF), pero en el aprendizaje automático, en su lugar, utilizamos la regularización para la selección de características y no parecemos verificar si las características están correlacionadas en absoluto. …

2
¿Las variables altamente correlacionadas en el bosque aleatorio distorsionan la precisión y la selección de características?
En mi opinión, las variables altamente correlacionadas no causarán problemas de multicolinealidad en el modelo de bosque aleatorio (corríjame si me equivoco). Sin embargo, por otro lado, si tengo demasiadas variables que contienen información similar, ¿el modelo pesará demasiado en este conjunto en lugar de los demás? Por ejemplo, hay …

3
¿Qué factor de inflación de varianza debo usar: o ?
Estoy tratando de interpretar la varianza factores de inflación utilizando el viffunción en el paquete R car. La función imprime un generalizado y también . Según el archivo de ayuda , este último valorVIFVIF\text{VIF}GVIF1 / ( 2 ⋅ df )GVIF1/ /(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Para ajustar la dimensión del elipsoide de confianza, la …

3
¿Cómo lidiar con la multicolinealidad al realizar la selección de variables?
Tengo un conjunto de datos con 9 variables independientes continuas. Estoy tratando de seleccionar entre estas variables para ajustar un modelo a una sola variable de porcentaje (dependiente) Score. Desafortunadamente, sé que habrá una colinealidad seria entre varias de las variables. Intenté usar la stepAIC()función en R para la selección …


2
El diagnóstico de colinealidad es problemático solo cuando se incluye el término de interacción
He realizado una regresión en los condados de EE. UU. Y estoy buscando colinealidad en mis variables 'independientes'. Los diagnósticos de regresión de Belsley, Kuh y Welsch sugieren mirar el índice de condición y las proporciones de descomposición de la varianza: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition …


2
¿La PCA es inestable bajo multicolinealidad?
Sé que en una situación de regresión, si tiene un conjunto de variables altamente correlacionadas, esto generalmente es "malo" debido a la inestabilidad en los coeficientes estimados (la varianza va hacia el infinito a medida que el determinante va hacia cero). Mi pregunta es si esta "maldad" persiste en una …


1
¿Hay alguna razón para preferir una medida específica de multicolinealidad?
Cuando trabajamos con muchas variables de entrada, a menudo nos preocupa la multicolinealidad . Existen varias medidas de multicolinealidad que se utilizan para detectar, pensar y / o comunicar multicolinealidad. Algunas recomendaciones comunes son: El múltiple R2jRj2R^2_j para una variable particular La tolerancia, 1−R2j1−Rj21-R^2_j , para una variable particular El …

1
¿Cómo lidiar con una alta correlación entre predictores en regresión múltiple?
Encontré una referencia en un artículo que dice así: Según Tabachnick y Fidell (1996), las variables independientes con una correlación bivariada de más de .70 no deberían incluirse en el análisis de regresión múltiple. Problema: utilicé en un diseño de regresión múltiple 3 variables correlacionadas> .80, VIF en aproximadamente .2 …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.