Estadísticas y Big Data weighted-regression

9

Libro de referencia para álgebra lineal aplicado a las estadísticas?

He estado trabajando en R por un tiempo y me he enfrentado a cosas como PCA, SVD, descomposiciones QR y muchos resultados de álgebra lineal (al inspeccionar estimaciones de regresiones ponderadas y demás), así que quería saber si alguien tiene una recomendación sobre un buen libro completo de álgebra lineal …

54 references matrix linear-algebra weighted-regression

2

¿Cómo encuentra pesos para la regresión de mínimos cuadrados ponderados?

Estoy un poco perdido en el proceso de regresión de WLS. Me han dado un conjunto de datos y mi tarea es probar si hay heterocedacidad, y si es así, debería ejecutar la regresión WLS. Llevé a cabo la prueba y encontré evidencia de heterocedacidad, así que necesito ejecutar el …

23 regression heteroscedasticity weighted-regression

1

¿Cuál es la intuición detrás de las muestras intercambiables bajo la hipótesis nula?

Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de prueba no paramétrica como Mann-Whitney-U-testconduciría a la …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

2

R: función glm con familia = especificación "binomial" y "peso"

Estoy muy confundido con cómo funciona el peso en glm con family = "binomial". En mi opinión, la probabilidad de la glm con family = "binomial" se especifica de la siguiente manera: f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny))f(y)=(nny)pny(1−p)n(1−y)=exp⁡(n[ylog⁡p1−p−(−log⁡(1−p))]+log⁡(nny)) f(y) = {n\choose{ny}} p^{ny} (1-p)^{n(1-y)} = \exp \left(n \left[ y \log \frac{p}{1-p} - \left(-\log (1-p)\right) \right] + …

14 r logistic generalized-linear-model binomial weighted-regression

1

Relaciones en regresión, también conocidas como preguntas sobre Kronmal

Recientemente, las preguntas de exploración aleatoria activaron un recuerdo de comentarios fuera de la mano de uno de mis profesores hace unos años, advirtiendo sobre el uso de proporciones en los modelos de regresión. Entonces comencé a leer sobre esto, y finalmente llegué a Kronmal 1993. Quiero asegurarme de que …

14 regression modeling interaction weighted-regression ratio

2

La media armónica minimiza la suma de los errores relativos al cuadrado

Estoy buscando una referencia donde se pruebe que la media armónica x¯h=n∑ni=11xix¯h=n∑i=1n1xi\bar{x}^h = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}} minimiza (en ) la suma de los errores relativos al cuadradozzz ∑i=1n((xi−z)2xi).∑i=1n((xi−z)2xi).\sum_{i=1}^n \left( \frac{(x_i - z)^2}{x_i}\right).

13 references mean error weighted-regression harmonic-mean

5

¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?

Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

La teoría detrás del argumento de los pesos en R cuando se usa lm ()

Después de un año en la escuela de posgrado, mi comprensión de los "mínimos cuadrados ponderados" es la siguiente: let , sea una matriz de diseño , \ boldsymbol \ beta \ in \ mathbb {R} ^ p sea un vector de parámetros, \ boldsymbol \ epsilon \ in \ …

12 r linear-model weighted-regression

1

¿Explicación intuitiva para la probabilidad inversa de ponderaciones de tratamiento (IPTW) en la ponderación de puntaje de propensión?

Entiendo la mecánica de calcular los pesos usando los puntajes de propensión : y luego aplica los pesos en un análisis de regresión, y que los pesos sirven para "controlar" o disociar los efectos de las covariables en las poblaciones del grupo de tratamiento y control con la variable de …

10 intuition weighted-regression propensity-scores

3

Regresión generalizada ponderada en BUGS, JAGS

En Rpodemos "ponderar previamente" una glmregresión a través del parámetro de pesos . Por ejemplo: glm.D93 <- glm(counts ~ outcome + treatment, family = poisson(), weights=w) ¿Cómo se puede lograr esto en una JAGSo BUGSmodelo? Encontré un artículo discutiendo esto, pero ninguno de ellos proporciona un ejemplo. Me interesan principalmente …

10 bayesian generalized-linear-model jags bugs weighted-regression

1

Definición de pesos mínimos cuadrados ponderados: función R lm vs.

¿Alguien podría decirme por qué obtengo resultados diferentes de Rmínimos cuadrados ponderados y solución manual por operación de matriz ? Específicamente, estoy tratando de resolver manualmente , donde es la matriz diagonal en los pesos, es la matriz de datos, es la respuesta vector. W A bW A x = …

9 r regression least-squares weighted-regression weighted-data

2

Agregar ponderaciones para conjuntos de datos altamente sesgados en regresión logística

Estoy usando una versión estándar de regresión logística para ajustar mis variables de entrada a las variables de salida binarias. Sin embargo, en mi problema, las salidas negativas (0s) superan con creces a las salidas positivas (1s). La relación es 20: 1. Entonces, cuando entreno un clasificador, parece que incluso …

9 regression logistic weighted-regression

3

Usando pesos de regresión cuando

Supongamos que observamos datos Y, XY,XY, X y me gustaría ajustar un modelo de regresión para E [YEl |X]E[Y|X]\mathbf{E}[Y \,|\, X]. Desafortunadamente,YYY a veces se mide con errores cuya media es distinta de cero. Dejar Z∈ { imparcial , sesgado }Z∈{unbiased,biased}Z \in \left\{\text{unbiased}, \text{biased}\right\} clima indicado YYYse mide con errores …

8 regression bias measurement-error weighted-regression

2

¿Cómo hacer las correcciones de eventos raros descritos en King y Zeng (2001)?

Tengo un conjunto de datos con una variable de respuesta binaria (supervivencia) y 3 variables explicativas ( A= 3 niveles, B= 3 niveles, C= 6 niveles). En este conjunto de datos, los datos están bien equilibrados, con 100 individuos por ABCcategoría. Ya se estudió el efecto de éstos A, By …

8 logistic unbalanced-classes weighted-regression rare-events case-control-study

2

¿Por qué un modelo estadístico se sobreajusta si se le da un gran conjunto de datos?

Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly spend en el cual monthly spendestá …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

Preguntas etiquetadas con weighted-regression