Estadísticas y Big Data regression

2

¿Por qué los modelos de "error en X" no se usan más ampliamente?

Cuando se calcula el error estándar de un coeficiente de regresión, no tenemos en cuenta la aleatoriedad en la matriz de diseño . En OLS, por ejemplo, calculamos comoXXXvar(β^)var(β^)\text{var}(\hat{\beta})var((XTX)−1XTY)=σ2(XTX)−1var((XTX)−1XTY)=σ2(XTX)−1\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} Si la se considerara aleatoria, la ley de la varianza total exigiría, en cierto sentido, la contribución adicional de …

11 regression probability variance inference

2

Que muestra la equivalencia entre el Norma regularizada Regresión y Norma restringida de regresión utilizando KKT

Según las referencias Libro 1 , Libro 2 y papel . Se ha mencionado que existe una equivalencia entre la regresión regularizada (Ridge, LASSO y Elastic Net) y sus fórmulas de restricción. También he visto Cross Validated 1 y Cross Validated 2 , pero no puedo ver una respuesta clara …

11 regression optimization lasso ridge-regression elastic-net

3

¿Puede una regresión lineal ser significativa si los datos no son lineales?

Realicé una regresión lineal que resultó con un resultado significativo, sin embargo, cuando verifiqué la linealidad del diagrama de dispersión, no estaba seguro de que los datos fueran lineales. ¿Hay alguna otra forma de probar la linealidad sin inspeccionar el diagrama de dispersión? ¿Podría la regresión lineal ser significativa si …

11 regression

2

Comprender la forma del intervalo de confianza para la regresión polinómica (MLR)

Tengo dificultades para comprender la forma del intervalo de confianza de una regresión polinómica. Aquí hay un ejemplo artificial, . La figura de la izquierda muestra el UPV (varianza de predicción sin escala) y el gráfico de la derecha muestra el intervalo de confianza y los puntos medidos (artificiales) en …

11 regression confidence-interval

1

¿Deben usarse correcciones de grados de libertad para la inferencia en los parámetros GLM?

Esta pregunta está inspirada en la respuesta de Martijn aquí . var [ X] = E[ X] E[ 1 - X]var[X]=E[X]E[1−X]\text{var}[X] = E[X]E[1-X]var [ X] = E[ X]var[X]=E[X]\text{var}[X] = E[X] A diferencia de la regresión lineal cuando los residuos se distribuyen normalmente, no se conoce la distribución de muestreo exacta …

11 regression generalized-linear-model inference approximation t-distribution

1

Regresión lineal multivariante versus varios modelos de regresión univariante

En la configuración de regresión univariante, intentamos modelar y= Xβ+ n o i s ey=Xβ+noisey = X\beta +noise donde un vector de n observaciones y X ∈ R n × m la matriz de diseño con m predictores. La solución es β 0 = ( X T X ) - …

11 regression multivariate-analysis multivariate-regression

2

¿Por qué son idénticas estas tablas de regresión anova?

Tengo dos regresiones de la misma Y y X de tres niveles. En general n = 15, con n = 5 en cada grupo o nivel de X. La primera regresión trata la X como categórica, asignando variables indicadoras a los niveles 2 y 3 con nivel Uno es la …

11 regression anova

4

¿Por qué los métodos de regresión de mínimos cuadrados y máxima verosimilitud no son equivalentes cuando los errores no se distribuyen normalmente?

El título lo dice todo. Entiendo que los mínimos cuadrados y la máxima verosimilitud darán el mismo resultado para los coeficientes de regresión si los errores del modelo se distribuyen normalmente. Pero, ¿qué sucede si los errores no se distribuyen normalmente? ¿Por qué los dos métodos ya no son equivalentes?

11 regression normal-distribution maximum-likelihood least-squares error

4

Redes neuronales artificiales ¿EQUIVALENTES a la regresión lineal con características polinómicas?

Quiero mejorar mi comprensión de las redes neuronales y sus beneficios en comparación con otros algoritmos de aprendizaje automático. Mi comprensión es la siguiente y mi pregunta es: ¿Pueden corregir y complementar mi comprensión por favor? :) Mi entendimiento: (1) Redes neuronales artificiales = Una función, que predice valores de …

11 regression machine-learning

2

¿Dividir los datos en conjuntos de prueba y entrenamiento es puramente una "estadística"?

Soy un estudiante de física que estudia el aprendizaje automático / ciencia de datos, así que no me refiero a que esta pregunta inicie ningún conflicto :) Sin embargo, una gran parte de cualquier programa de pregrado de física es hacer laboratorios / experimentos, lo que significa una gran cantidad …

11 regression machine-learning cross-validation dataset experiment-design

1

Cómo interpretar los resultados cuando tanto la cresta como el lazo funcionan bien por separado pero producen coeficientes diferentes

Estoy ejecutando un modelo de regresión con Lasso y Ridge (para predecir una variable de resultado discreta que va de 0 a 5). Antes de ejecutar el modelo, utilizo el SelectKBestmétodo de scikit-learnreducir el conjunto de características de 250 a 25 . Sin una selección inicial de características, tanto Lasso …

11 regression predictive-models feature-selection lasso ridge-regression

2

Si no puede hacerlo ortogonalmente, hágalo sin procesar (regresión polinómica)

Al realizar una regresión polinómica para sobre , las personas a veces usan polinomios en bruto, a veces polinomios ortogonales. Pero cuando usan lo que parece completamente arbitrario.XYYYXXX Aquí y aquí se utilizan polinomios en bruto. Pero aquí y aquí , los polinomios ortogonales parecen dar los resultados correctos. ¿Qué, …

11 regression polynomial

2

Si la contracción se aplica de manera inteligente, ¿siempre funciona mejor para estimadores más eficientes?

Supongamos que tengo dos estimadores y que son estimadores consistentes del mismo parámetro y tal que con en el sentido psd. Por lo tanto, asintóticamente es más eficiente que . Estos dos estimadores se basan en diferentes funciones de pérdida.βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0n−−√(βˆ1−β0)→dN(0,V1),n−−√(βˆ2−β0)→dN(0,V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_1), \quad \sqrt{n}(\widehat{\beta}_2 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_2)V1≤V2V1≤V2V_1 …

11 regression ridge-regression shrinkage penalized

3

Regresión con datos sesgados

Intentando calcular el recuento de visitas a partir de la demografía y el servicio. Los datos están muy sesgados. Histogramas: parcelas qq (a la izquierda está el registro): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityy serviceson variables factoriales. Obtengo un valor p bajo *** para todas las variables, pero también …

11 regression multiple-regression predictive-models exponential qq-plot

1

¿Qué tan diferente es la regresión de vectores de soporte en comparación con SVM?

Sé lo básico sobre SVM y SVR, pero aún no entiendo cómo encaja el problema de encontrar un hiperplano que maximice el margen en SVR. Segundo, leí algo sobre usado como margen de tolerancia en SVR. Qué significa eso?ϵϵ\epsilon Tercero, ¿hay alguna diferencia entre los parámetros de la función de …

11 regression machine-learning svm

Preguntas etiquetadas con regression