Preguntas etiquetadas con clustering

El análisis de conglomerados es la tarea de dividir los datos en subconjuntos de objetos de acuerdo con su "similitud" mutua, sin utilizar el conocimiento preexistente como las etiquetas de clase. [Los errores estándar agrupados y / o las muestras de agrupación deben etiquetarse como tales; NO use la etiqueta de "agrupamiento" para ellos.]

2
Agrupación de datos de recuento muy sesgados: ¿alguna sugerencia para realizar (transformar, etc.)?
Problema básico Aquí está mi problema básico: estoy tratando de agrupar un conjunto de datos que contiene algunas variables muy sesgadas con recuentos. Las variables contienen muchos ceros y, por lo tanto, no son muy informativas para mi procedimiento de agrupación, que probablemente sea el algoritmo k-means. Bien, dices, simplemente …



3
Métodos de inicialización de agrupamiento de K-medias
Estoy interesado en el estado actual de la técnica para seleccionar semillas iniciales (centros de agrupación) para K-means. Buscar en Google lleva a dos opciones populares: selección aleatoria de semillas iniciales, y utilizando la técnica de selección KMeans ++: Arthur & Vassilvitskii 2006 k-means ++: Las ventajas de la siembra …

3
¿Cuáles son los métodos estadísticos que puedo usar para encontrar combinaciones populares o comunes de variables categóricas?
Estoy haciendo un estudio sobre el uso de polidrogas. Tengo un conjunto de datos de 400 drogadictos, cada uno de los cuales declaró las drogas que abusan. Hay más de 10 medicamentos y, por lo tanto, hay grandes combinaciones posibles. He recodificado la mayoría de las drogas que consumen en …



1
¿Cómo debo interpretar la estadística GAP?
Utilicé la estadística GAP para estimar k grupos en R. Sin embargo, no estoy seguro de interpretarlo bien. De la trama anterior, supongo que debería usar 3 grupos. De la segunda trama, debería elegir 6 grupos. ¿Es correcta la interpretación de la estadística GAP? Agradecería cualquier explicación.
10 clustering 



3
Cómo obtener el intervalo de confianza en el cambio de r-cuadrado poblacional
Por un simple ejemplo, suponga que hay dos modelos de regresión lineal Modelo 1 tiene tres predictores, x1a, x2b, yx2c El modelo 2 tiene tres predictores del modelo 1 y dos predictores adicionales x2ayx2b Hay una ecuación de regresión poblacional donde la varianza poblacional explicada es para el Modelo 1 …



1
¿Por qué Anova () y drop1 () proporcionaron diferentes respuestas para GLMM?
Tengo un GLMM de la forma: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Cuando lo uso drop1(model, test="Chi"), obtengo resultados diferentes a los que uso Anova(model, type="III")del paquete del automóvil o summary(model). Estos dos últimos dan las mismas respuestas. Usando un montón de …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.