Preguntas etiquetadas con k-means

k-means es un método para dividir datos en clusters al encontrar un número específico de medias, k, st cuando los datos se asignan a clusters w / la media más cercana, la suma de cuadrados w / i cluster se minimiza





8
Realice clusters de K-means (o sus parientes cercanos) con solo una matriz de distancia, no datos de puntos por características
Quiero realizar la agrupación K-means en los objetos que tengo, pero los objetos no se describen como puntos en el espacio, es decir, por objects x featuresconjunto de datos. Sin embargo, puedo calcular la distancia entre dos objetos (se basa en una función de similitud). Entonces, dispongo de la matriz …


4
Agrupando una matriz de correlación
Tengo una matriz de correlación que establece cómo cada elemento se correlaciona con el otro elemento. Por lo tanto, para N elementos, ya tengo una matriz de correlación N * N. Usando esta matriz de correlación, ¿cómo agrupo los N elementos en M bins para poder decir que los Nk …

2
Prueba de convergencia de k-medias
Para una tarea, se me ha pedido que proporcione una prueba de que k-means converge en un número finito de pasos. Esto es lo que he escrito: CCCE(C)=∑xmini=1k∥x−ci∥2E(C)=∑xmini=1k‖x−ci‖2E(C)=\sum_{\mathbf{x}}\min_{i=1}^{k}\left\Vert \mathbf{x}-\mathbf{c}_{i}\right\Vert ^{2}E(C)E(C)E(C) El paso 2 se refiere al paso que etiqueta cada punto de datos por su centro de clúster más cercano, …

4
¿Cómo entender los inconvenientes de la agrupación jerárquica?
¿Alguien puede explicar los pros y los contras de la agrupación jerárquica? ¿El agrupamiento jerárquico tiene los mismos inconvenientes que K significa? ¿Cuáles son las ventajas del agrupamiento jerárquico sobre K? ¿Cuándo debemos usar los medios K sobre el agrupamiento jerárquico y viceversa? Las respuestas a esta publicación explican los …





4
La precisión de la máquina de aumento de gradiente disminuye a medida que aumenta el número de iteraciones
Estoy experimentando con el algoritmo de la máquina de aumento de gradiente a través del caretpaquete en R. Usando un pequeño conjunto de datos de admisión a la universidad, ejecuté el siguiente código: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
¿La maldición de la dimensionalidad afecta a algunos modelos más que a otros?
Los lugares que he estado leyendo sobre la maldición de la dimensionalidad lo explican conjuntamente con kNN principalmente, y los modelos lineales en general. Regularmente veo a los mejores clasificados en Kaggle usando miles de características en el conjunto de datos que apenas tiene 100k puntos de datos. Utilizan principalmente …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.