Preguntas etiquetadas con clustering

El análisis de conglomerados es la tarea de dividir los datos en subconjuntos de objetos de acuerdo con su "similitud" mutua, sin utilizar el conocimiento preexistente como las etiquetas de clase. [Los errores estándar agrupados y / o las muestras de agrupación deben etiquetarse como tales; NO use la etiqueta de "agrupamiento" para ellos.]

1
Sobre correlación cophenetic para la agrupación de dendrogramas
Considere el contexto de una agrupación de dendrogramas. Llamemos disimilitudes originales a las distancias entre los individuos. Después de construir el dendrograma, definimos la disparidad copénetica entre dos individuos como la distancia entre los grupos a los que pertenecen estos individuos. Algunas personas consideran que la correlación entre las diferencias …

2
Detección de grupos de códigos fuente "similares"
Supongamos que tengo 400 estudiantes (que están en una gran universidad) que tienen que hacer un proyecto de informática y que tienen que trabajar solos (sin grupo de estudiantes). Un ejemplo de proyecto podría ser "implementar un algoritmo rápido de transformación de Fourier en fortran" (lo sé, eso no suena …

3
Distribuciones agrupadas
Tengo varias distribuciones (10 distribuciones en la figura a continuación). De hecho, estos son histogramas: hay 70 valores en el eje x que son los tamaños de algunas partículas en una solución y para cada valor de x el valor correspondiente de y es la proporción de partículas cuyo tamaño …
10 clustering 

3
¿Cómo agrupar variables longitudinales?
Tengo un montón de variables que contienen datos longitudinales desde el día 0 hasta el día 7. Estoy buscando un enfoque de agrupamiento apropiado que pueda agrupar estas variables longitudinales (no casos) en diferentes grupos. Traté de analizar este conjunto de datos por separado por tiempo, pero el resultado fue …
10 clustering 

2
Detecta patrones circulares en datos de nube de puntos
Para algunos algoritmos de reconstrucción de volumen en los que estoy trabajando, necesito detectar un número arbitrario de patrones circulares en datos de puntos 3D (provenientes de un dispositivo LIDAR). Los patrones se pueden orientar arbitrariamente en el espacio y se supone que se encuentran (aunque no perfectamente) en planos …

1
Usando el paquete de estadísticas en R para kmeans clustering
Tengo dificultades para comprender uno o dos aspectos del paquete de clúster. Estoy siguiendo de cerca el ejemplo de Quick-R , pero no entiendo uno o dos aspectos del análisis. He incluido el código que estoy usando para este ejemplo en particular. ## Libraries library(stats) library(fpc) ## Data mydata = …
10 r  clustering 



2
Diferencia entre PCA y agrupación espectral para un pequeño conjunto de muestras de características booleanas
Tengo un conjunto de datos de 50 muestras. Cada muestra se compone de 11 características booleanas (posiblemente correlacionadas). Me gustaría ver de alguna manera cómo visualizar estas muestras en una gráfica 2D y examinar si hay grupos / agrupaciones entre las 50 muestras. He intentado los siguientes dos enfoques: (a) …

1
R regresión lineal variable categórica valor "oculto"
Este es solo un ejemplo que he encontrado varias veces, por lo que no tengo ningún dato de muestra. Ejecutar un modelo de regresión lineal en R: a.lm = lm(Y ~ x1 + x2) x1Es una variable continua. x2es categórico y tiene tres valores, por ejemplo, "Bajo", "Medio" y "Alto". …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 



1
¿Qué modelo de aprendizaje profundo puede clasificar categorías que no son mutuamente excluyentes?
Ejemplos: Tengo una oración en la descripción del trabajo: "Ingeniero senior de Java en el Reino Unido". Quiero usar un modelo de aprendizaje profundo para predecirlo en 2 categorías: English y IT jobs. Si uso el modelo de clasificación tradicional, solo puede predecir 1 etiqueta con softmaxfunción en la última …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Índice Rand Ajustado vs Información Mutua Ajustada
Estoy tratando de evaluar el rendimiento de la agrupación. Estaba leyendo la documentación de skiscit-learn sobre métricas . No entiendo la diferencia entre ARI y AMI. Me parece que hacen lo mismo de dos maneras diferentes. Citando de la documentación: Dado el conocimiento de las asignaciones de clase de verdad …

2
Aplicando inferencia variacional estocástica a la mezcla bayesiana de gaussiana
Estoy tratando de implementar el modelo de mezcla gaussiana con inferencia variacional estocástica, siguiendo este artículo . Esta es la pgm de Gaussian Mixture. Según el artículo, el algoritmo completo de inferencia variacional estocástica es: Y todavía estoy muy confundido con el método para escalarlo a GMM. Primero, pensé que …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.