Preguntas etiquetadas con clustering

El análisis de conglomerados es la tarea de dividir los datos en subconjuntos de objetos de acuerdo con su "similitud" mutua, sin utilizar el conocimiento preexistente como las etiquetas de clase. [Los errores estándar agrupados y / o las muestras de agrupación deben etiquetarse como tales; NO use la etiqueta de "agrupamiento" para ellos.]





1
Estado del arte en deduplicación
¿Cuáles son los métodos más avanzados en deduplicación de registros? La deduplicación también se denomina a veces: vinculación de registros, resolución de entidad, resolución de identidad, fusión / purga. Sé, por ejemplo, sobre CBLOCK [1]. Agradecería que las respuestas también incluyeran referencias al software existente que implementa los métodos. Sé, …

1
Una rutina para elegir eps y minPts para DBSCAN
DBSCAN es el algoritmo de agrupación más citado de acuerdo con cierta literatura y puede encontrar agrupaciones de formas arbitrarias basadas en la densidad. Tiene dos parámetros eps (como radio de vecindad) y minPts (como vecinos mínimos para considerar un punto como punto central) que creo que depende en gran …


5
¿Técnicas de agrupamiento apropiadas para datos temporales?
Tengo datos temporales de frecuencias de actividad. Quiero identificar grupos en los datos que indican distintos períodos de tiempo con niveles de actividad similares. Idealmente, quiero identificar los grupos sin especificar el número de grupos a priori. ¿Cuáles son las técnicas de agrupamiento apropiadas? Si mi pregunta no contiene suficiente …


2
Uso de la prueba de significación estadística para validar los resultados del análisis de conglomerados
Estoy estudiando el uso de las pruebas de significación estadística (SST) para validar los resultados del análisis de conglomerados. He encontrado varios artículos sobre este tema, como " Importancia estadística de la agrupación para datos de alta dimensión y bajo tamaño de muestra " por Liu, Yufeng et al. (2008) …

2
Comprender las comparaciones de resultados de agrupamiento
Estoy experimentando con la clasificación de datos en grupos. Soy bastante nuevo en este tema e intento comprender el resultado de algunos de los análisis. Usando ejemplos de Quick-R , Rse sugieren varios paquetes. He intentado usar dos de estos paquetes ( fpcusando la kmeansfunción y mclust). Un aspecto de …
13 r  clustering 

1
LARS vs descenso coordinado para el lazo
¿Cuáles son los pros y los contras de usar LARS [1] versus usar el descenso coordinado para ajustar la regresión lineal regularizada por L1? Estoy principalmente interesado en los aspectos de rendimiento (mis problemas tienden a tener Ncientos de miles y p<20). Sin embargo, cualquier otra información también sería apreciada. …



3
¿Necesito descartar variables que estén correlacionadas / colineales antes de ejecutar kmeans?
Estoy ejecutando kmeans para identificar grupos de clientes. Tengo aproximadamente 100 variables para identificar grupos. Cada una de estas variables representa el% de gasto de un cliente en una categoría. Entonces, si tengo 100 categorías, tengo estas 100 variables, de modo que la suma de estas variables es del 100% …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.