Estadísticas y Big Data categorical-data

2

¿Es posible crear una trama de "conjuntos paralelos" usando R?

Bloqueado . Esta pregunta y sus respuestas están bloqueadas porque la pregunta está fuera de tema pero tiene un significado histórico. Actualmente no acepta nuevas respuestas o interacciones. Gracias a la pregunta de Tormod (publicada aquí ) me encontré con la trama de Conjuntos paralelos . Aquí hay un ejemplo …

16 r data-visualization categorical-data interactive-visualization

4

La precisión de la máquina de aumento de gradiente disminuye a medida que aumenta el número de iteraciones

Estoy experimentando con el algoritmo de la máquina de aumento de gradiente a través del caretpaquete en R. Usando un pequeño conjunto de datos de admisión a la universidad, ejecuté el siguiente código: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

2

"Variable ficticia" versus "variable indicadora" para datos nominales / categóricos

"Variable ficticia" y "variable indicadora" son etiquetas que se usan con frecuencia para describir la pertenencia a una categoría con codificación 0/1; generalmente 0: no es miembro de la categoría, 1: miembro de la categoría. El 26/11/2014, una búsqueda rápida en scholar.google.com (con comillas adjuntas) revela que la "variable ficticia" …

15 categorical-data terminology categorical-encoding

1

¿Cuál es la intuición detrás de las muestras intercambiables bajo la hipótesis nula?

Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de prueba no paramétrica como Mann-Whitney-U-testconduciría a la …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

2

¿Mezclando datos continuos y binarios con SVM lineal?

Así que he estado jugando con SVM y me pregunto si esto es algo bueno: Tengo un conjunto de características continuas (0 a 1) y un conjunto de características categóricas que convertí en variables ficticias. En este caso particular, codifico la fecha de la medición en una variable ficticia: Hay …

15 categorical-data svm feature-selection linear-model feature-construction

1

¿Puede la regresión logística de glmnet manejar directamente las variables factoriales (categóricas) sin necesidad de variables ficticias? [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 3 años . Estoy construyendo una regresión logística en R usando el método LASSO con las funciones cv.glmnetpara seleccionar …

15 r logistic categorical-data lasso glmnet

2

¿Podemos usar una variable independiente categórica en el análisis discriminante?

En el análisis discriminante, la variable dependiente es categórica, pero ¿puedo usar una variable categórica (por ejemplo, estado residencial: rural, urbano) junto con alguna otra variable continua como variable independiente en el análisis discriminante lineal?

15 logistic categorical-data discriminant-analysis regression-strategies

2

¿Pasar de datos continuos a categóricos siempre está mal?

Cuando leo sobre cómo configurar sus datos, una cosa que a menudo me encuentro es que transformar algunos datos continuos en datos categóricos no es una buena idea, ya que es muy posible que llegue a una conclusión incorrecta si los umbrales están mal determinados. Sin embargo, actualmente tengo algunos …

14 categorical-data continuous-data

3

¿Por qué la correlación no es muy útil cuando una de las variables es categórica?

Esto es un poco de verificación intestinal, por favor, ayúdenme a ver si estoy malinterpretando este concepto y de qué manera. Tengo una comprensión funcional de la correlación, pero me siento un poco aferrado a las pajitas para explicar con confianza los principios detrás de esa comprensión funcional. Según tengo …

14 correlation categorical-data covariance

2

¿Cómo hacer la regresión con la codificación de efectos en lugar de la codificación ficticia en R?

Actualmente estoy trabajando en un modelo de regresión donde solo tengo variables categóricas / factoriales como variables independientes. Mi variable dependiente es una relación transformada logit. Es bastante fácil ejecutar una regresión normal en R, ya que R sabe automáticamente cómo codificar dummies tan pronto como son del tipo "factor". …

14 r regression categorical-data categorical-encoding

1

¿Está bien mezclar datos categóricos y continuos para SVM (Support Vector Machines)?

Tengo un conjunto de datos como +--------+------+-------------------+ | income | year | use | +--------+------+-------------------+ | 46328 | 1989 | COMMERCIAL EXEMPT | | 75469 | 1998 | CONDOMINIUM | | 49250 | 1950 | SINGLE FAMILY | | 82354 | 2001 | SINGLE FAMILY | | 88281 | 1985 …

14 categorical-data svm mixed-type-data

1

¿Cuáles son los diferentes tipos de codificaciones disponibles para las variables categóricas (en R) y cuándo las usaría?

Si se ajusta a un modelo lineal o un modelo mixto, hay diferentes tipos de codificaciones disponibles para transformar una variable categórica o nominal en una serie de variables para las que se estiman los parámetros, como la codificación ficticia (el valor predeterminado de R) y la codificación de efectos. …

14 regression mixed-model categorical-data contrasts categorical-encoding

2

¿Métodos para fusionar / reducir categorías en datos ordinales o nominales?

Estoy luchando por encontrar un método para reducir el número de categorías en datos nominales u ordinales. Por ejemplo, supongamos que quiero construir un modelo de regresión en un conjunto de datos que tenga varios factores nominales y ordinales. Si bien no tengo problemas con este paso, a menudo me …

14 r categorical-data dimensionality-reduction many-categories

8

Entrene una red neuronal para distinguir entre números pares e impares

Pregunta: ¿es posible entrenar a un NN para distinguir entre números pares e impares solo usando como entrada los números mismos? Tengo el siguiente conjunto de datos: Number Target 1 0 2 1 3 0 4 1 5 0 6 1 ... ... 99 0 100 1 Entrené a un …

14 machine-learning classification categorical-data neural-networks genetic-algorithms

3

Reemplazo de variables por WoE (peso de la evidencia) en regresión logística

Esta es una pregunta sobre una práctica o método seguido por algunos de mis colegas. Al hacer un modelo de regresión logística, he visto a personas reemplazar las variables categóricas (o variables continuas que están agrupadas) con su respectivo peso de evidencia (WoE). Se supone que esto se hace para …

14 regression logistic categorical-data modeling

Preguntas etiquetadas con categorical-data