Preguntas etiquetadas con multicollinearity

Situación cuando existe una fuerte relación lineal entre las variables predictoras, de modo que su matriz de correlación se vuelve (casi) singular. Esta "mala condición" hace que sea difícil determinar el papel único que desempeña cada uno de los predictores: surgen problemas de estimación y aumentan los errores estándar. Los predictores correlacionados bivariablemente muy altos son un ejemplo de multicolinealidad.

2
La codificación de variables cualitativas en regresión conduce a "singularidades"
Tengo una variable independiente llamada "calidad"; Esta variable tiene 3 modalidades de respuesta (mala calidad; calidad media; alta calidad). Quiero introducir esta variable independiente en mi regresión lineal múltiple. Cuando tengo una variable independiente binaria (variable ficticia, puedo codificar 0/ 1) es fácil introducirla en un modelo de regresión lineal …



3
¿Cuándo podemos hablar de colinealidad?
En los modelos lineales necesitamos verificar si existe una relación entre las variables explicativas. Si se correlacionan demasiado, entonces hay colinealidad (es decir, las variables se explican parcialmente entre sí). Actualmente solo estoy mirando la correlación por pares entre cada una de las variables explicativas. Pregunta 1: ¿Qué clasifica como …

1
¿Por qué esta regresión NO falla debido a la perfecta multicolinealidad, aunque una variable es una combinación lineal de otras?
Hoy, estaba jugando con un pequeño conjunto de datos y realicé una regresión OLS simple que esperaba que fallara debido a la perfecta multicolinealidad. Sin embargo, no fue así. Esto implica que mi comprensión de la multicolinealidad es incorrecta. Mi pregunta es: ¿Dónde me equivoco? Creo que puedo mostrar que …

1
¿Cuál es la intuición detrás de las muestras intercambiables bajo la hipótesis nula?
Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de prueba no paramétrica como Mann-Whitney-U-testconduciría a la …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 


4
¿Debería preocuparse la multicolinealidad cuando se utilizan modelos no lineales?
Digamos que tenemos un problema de clasificación binaria con características principalmente categóricas. Utilizamos algún modelo no lineal (por ejemplo, XGBoost o Random Forests) para aprenderlo. ¿Debería preocuparse por la multicolinealidad? ¿Por qué? Si la respuesta a lo anterior es verdadera, ¿cómo debería uno luchar contra ella teniendo en cuenta que …

2
Regresión lineal cuando solo conoces
Supongamos .Xβ=YXβ=YX\beta =Y No sabemos exactamente, sólo su correlación con cada predictor, .X t YYYYXtYXtYX^\mathrm{t}Y La solución de mínimos cuadrados ordinarios (OLS) es y no hay ningún problema.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Pero supongamos que es casi singular (multicolinealidad), y necesita estimar el parámetro óptimo de cresta. Todos los métodos parece necesitar …

2
¿Qué son las pruebas de fragmentos?
En respuesta a una pregunta sobre la selección de modelos en presencia de multicolinealidad , Frank Harrell sugirió : Ponga todas las variables en el modelo pero no pruebe el efecto de una variable ajustada por los efectos de las variables competidoras ... Las pruebas fragmentarias de las variables competidoras …



3
¿Necesito descartar variables que estén correlacionadas / colineales antes de ejecutar kmeans?
Estoy ejecutando kmeans para identificar grupos de clientes. Tengo aproximadamente 100 variables para identificar grupos. Cada una de estas variables representa el% de gasto de un cliente en una categoría. Entonces, si tengo 100 categorías, tengo estas 100 variables, de modo que la suma de estas variables es del 100% …

3
¿Cómo puede manejar estimaciones
¿Estabilidad beta en regresión lineal con alta multicolinealidad? Digamos que en una regresión lineal, las variables y x 2 tienen una alta multicolinealidad (la correlación es de alrededor de 0.9).X1x1x_1X2x2x_2 Nos preocupa la estabilidad del coeficiente , por lo que debemos tratar la multicolinealidad.ββ\beta La solución del libro de texto …

2
Tratando con multicolinealidad
Aprendí que usando el vif()método de carpaquete, podemos calcular el grado de multicolinealidad de las entradas en un modelo. En wikipedia , si el vifvalor es mayor que 5entonces, podemos considerar que la entrada sufre un problema de multicolinealidad. Por ejemplo, he desarrollado un modelo de regresión lineal utilizando el …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.