¿Libros o artículos recomendados como introducción al análisis de conglomerados?

12

Estoy trabajando en un pequeño corpus de texto (200M), que quiero explorar con algunos análisis de conglomerados. ¿Qué libros o artículos sobre ese tema recomendarías?

machine-learning references clustering

— miku
fuente

6

Puede valer la pena mirar los libros de MW Berry:

Encuesta de minería de texto I: agrupamiento, clasificación y recuperación (2003)
Encuesta de minería de textos II: agrupamiento, clasificación y recuperación (2008)

Consisten en series de documentos aplicados y de revisión. El último parece estar disponible como PDF en la siguiente dirección: http://bit.ly/deNeiy .

Aquí hay algunos enlaces relacionados con CA aplicados a la minería de texto:

También puede ver el análisis semántico latente , pero vea mi respuesta allí: resolver un problema de agrupamiento .

— chl
fuente

5

Encontrar grupos en los datos. Una introducción al análisis de conglomerados de los profesores Leonard Kaufman y Peter J. Rousseeuw.

Estoy leyendo el libro y lo encuentro muy útil porque:

Como lo afirman los autores en el prefacio:

Nuestro propósito era escribir un libro aplicado para el usuario general. Queríamos hacer que el análisis de conglomerados esté disponible para personas que no necesariamente tienen una sólida base matemática o estadística.

Proporciona contenido teórico para comprender las funciones disponibles en el Rpaquete Cluster .
Los capítulos se pueden leer individualmente de acuerdo con el método de agrupación de interés.
_{la excepción es el capítulo 3, que se basa en el capítulo 2}

Los capítulos del libro son:

Introducción
Particionamiento en torno a medoides (Programa PAM).
Agrupación de aplicaciones grandes (Programa CLARA).
Análisis difuso (Programa DIVERTIDO).
Anidamiento aglomerativo (Programa AGNES).
Análisis divisivo (Programa DIANA).
Análisis Monotetico (Programa MONA).

Referencias

Kaufman, L. y Rousseeuw, PJ (2005). Encontrar grupos en los datos. Una introducción al análisis de conglomerados (p. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Análisis de clúster ampliado Rousseeuw et al. CRAN

— Andre Silva
fuente

Este libro de hecho proporciona una buena visión general del campo. Se centra en algunos algoritmos / métodos (por ejemplo, la conocida silueta, que resultó haber sido diseñada por uno de los autores del libro) y los cubre ampliamente. También viene con algo de código, pero estilo 1990. FYI: tabla de contenido completa .

— Franck Dernoncourt

4

Este capítulo de Introducción a la minería de datos está disponible en línea y ofrece una buena descripción general.

— Shane
fuente

Y aquí está el enlace a la segunda edición (2018).

— Richard Hardy

2

Cluster Analysis de Brian S. Everitt es un buen tratamiento de Cluster Analysis aplicado en longitud de libro.

— Brett
fuente

1

No específicamente sobre minería de texto, pero me gustó bastante el "Análisis de datos exploratorios con MATLAB" de Martínez y Martínez.

— nico
fuente

1

Otro libro en profundidad que vale la pena mirar: Manual de Análisis de Clúster por Hennig et al. (2015)

— tbeck
fuente