Recientemente he leído cuatro libros en este campo:
Feldman, R. y James Sanger, J. (2006). El manual de minería de texto: enfoques avanzados en el análisis de datos no estructurados. Prensa de la Universidad de Cambridge.
Este se centra en ejemplos prácticos, software y minería de texto aplicada. Da múltiples ejemplos de uso práctico de minería de texto. Podría ser de interés si desea leer sobre aplicaciones comerciales de herramientas de minería de texto.
Srivastava, AN y Sahami, M. (2009). Minería de texto: clasificación, agrupamiento y aplicaciones. Chapman & Hall / CRC.
Es una serie de trabajos de investigación que se utilizan como ejemplos del uso de diferentes herramientas de minería de texto. Está bastante centrado como para la prueba introductoria.
Weiss, SM, Indurkhya, N., Zhang, T. y Damerau, F. (2005). Minería de texto: métodos predictivos para analizar información no estructurada.
Saltador.
Texto muy introductorio que describe algunos problemas generales.
Manning, C. (1999). Fundamentos del procesamiento estadístico del lenguaje natural. MIT Press.
Este es el mejor libro que ya leí sobre este tema. Está bien escrito, claro, profundiza en la teoría pero de manera práctica. Comienza con una introducción general, pero luego revisa algunos de los métodos y algoritmos más utilizados. Si tuviera que elegir un solo libro, le recomendaría este.
También puede encontrar fácilmente varios libros sobre procesamiento de lenguaje natural y minería de texto que se centran en usar R ( biblioteca tm ) o Python ( biblioteca nltk ).