Preguntas etiquetadas con clustering

El análisis de conglomerados es la tarea de dividir los datos en subconjuntos de objetos de acuerdo con su "similitud" mutua, sin utilizar el conocimiento preexistente como las etiquetas de clase. [Los errores estándar agrupados y / o las muestras de agrupación deben etiquetarse como tales; NO use la etiqueta de "agrupamiento" para ellos.]

3
¿Está bien usar la distancia de Manhattan con el enlace entre grupos de Ward en la agrupación jerárquica?
Estoy usando la agrupación jerárquica para analizar datos de series de tiempo. Mi código se implementa usando la función MathematicaDirectAgglomerate[...] , que genera grupos jerárquicos con las siguientes entradas: una matriz de distancia D El nombre del método utilizado para determinar la vinculación entre clústeres. He calculado la matriz de …


1
¿Cómo calcular la pureza?
En el análisis de conglomerados, ¿cómo calculamos la pureza? ¿Cuál es la ecuación? No estoy buscando un código para hacerlo por mí. Deje ωkωk\omega_k ser clúster k, y cjcjc_j sea ​​clase j. Entonces, ¿la pureza es prácticamente precisión? parece que estaban sumando la cantidad de clase verdaderamente clasificada por grupo …
15 clustering 

3
¿Cómo trazar la salida de datos de la agrupación?
Intenté agrupar un conjunto de datos (un conjunto de marcas) y obtuve 2 grupos. Me gustaría representarlo gráficamente. Poco confundido acerca de la representación, ya que no tengo las coordenadas (x, y). También buscando la función MATLAB / Python para hacerlo. EDITAR Creo que publicar datos aclara la pregunta. Tengo …

1
¿Qué método de comparación múltiple usar para un modelo lmer: lsmeans o glht?
Estoy analizando un conjunto de datos utilizando un modelo de efectos mixtos con un efecto fijo (condición) y dos efectos aleatorios (participante debido al diseño del sujeto y al par). El modelo se ha generado con el lme4paquete: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). A continuación, realicé una prueba de razón de probabilidad de este …


2
k-significa vs k-mediana?
Sé que hay un algoritmo de agrupación k-means y una mediana k. Uno que usa la media como el centro del grupo y el otro usa la mediana. Mi pregunta es: ¿cuándo / dónde usar cuál?



4
¿Cómo medir la forma del racimo?
Sé que esta pregunta no está bien definida, pero algunos grupos tienden a ser elípticos o se encuentran en un espacio dimensional inferior, mientras que otros tienen formas no lineales (en ejemplos 2D o 3D). ¿Hay alguna medida de no linealidad (o "forma") de los grupos? Tenga en cuenta que …

3
¿Alguien puede explicar la deformación dinámica del tiempo para determinar la similitud de series temporales?
Estoy tratando de comprender la medida dinámica de deformación del tiempo para comparar series de tiempo juntas. Tengo tres series de datos de series de tiempo como esta: T1 <- structure(c(0.000213652387565, 0.000535045478866, 0, 0, 0.000219346347883, 0.000359669104424, 0.000269469145783, 0.00016051364366, 0.000181950509461, 0.000385579332948, 0.00078170803205, 0.000747244535774, 0, 0.000622858922454, 0.000689084895259, 0.000487983408564, 0.000224744353298, 0.000416449765747, 0.000308388157895, 0.000198906016907, …


3
o métricas para la agrupación?
¿Alguien usa las métricas o para la agrupación, en lugar de ? Aggarwal et al., Sobre el sorprendente comportamiento de las métricas de distancia en el espacio de alta dimensión, dijeron (en 2001) queL1L1L_1L.5L.5L_.5L2L2L_2 L1L1L_1 es consistentemente más preferible que la métrica de distancia euclidiana para aplicaciones de minería de …

9
Software de visualización para agrupamiento
Bloqueado . Esta pregunta y sus respuestas están bloqueadas porque la pregunta está fuera de tema pero tiene un significado histórico. Actualmente no acepta nuevas respuestas o interacciones. Quiero agrupar ~ 22000 puntos. Muchos algoritmos de agrupamiento funcionan mejor con conjeturas iniciales de mayor calidad. ¿Qué herramientas existen que me …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.