Respuestas:
Puede valer la pena mirar los libros de MW Berry:
Consisten en series de documentos aplicados y de revisión. El último parece estar disponible como PDF en la siguiente dirección: http://bit.ly/deNeiy .
Aquí hay algunos enlaces relacionados con CA aplicados a la minería de texto:
También puede ver el análisis semántico latente , pero vea mi respuesta allí: resolver un problema de agrupamiento .
Encontrar grupos en los datos. Una introducción al análisis de conglomerados de los profesores Leonard Kaufman y Peter J. Rousseeuw.
Estoy leyendo el libro y lo encuentro muy útil porque:
Nuestro propósito era escribir un libro aplicado para el usuario general. Queríamos hacer que el análisis de conglomerados esté disponible para personas que no necesariamente tienen una sólida base matemática o estadística.
Proporciona contenido teórico para comprender las funciones disponibles en el R
paquete Cluster .
Los capítulos se pueden leer individualmente de acuerdo con el método de agrupación de interés.
la excepción es el capítulo 3, que se basa en el capítulo 2
Los capítulos del libro son:
Referencias
Kaufman, L. y Rousseeuw, PJ (2005). Encontrar grupos en los datos. Una introducción al análisis de conglomerados (p. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Análisis de clúster ampliado Rousseeuw et al. CRAN
Este capítulo de Introducción a la minería de datos está disponible en línea y ofrece una buena descripción general.
No específicamente sobre minería de texto, pero me gustó bastante el "Análisis de datos exploratorios con MATLAB" de Martínez y Martínez.
Otro libro en profundidad que vale la pena mirar: Manual de Análisis de Clúster por Hennig et al. (2015)