¿Hay algún artículo o discusión sobre la extracción de parte del texto que contenga la mayor parte de la información sobre el documento actual?
Por ejemplo, tengo un gran corpus de documentos del mismo dominio. Hay partes del texto que contienen la información clave de la que habla un solo documento. Quiero extraer algunas de esas partes y usarlas como una especie de resumen del texto. ¿Existe alguna documentación útil sobre cómo lograr algo como esto?
Sería realmente útil si alguien pudiera señalarme en la dirección correcta lo que debería buscar o leer para obtener una idea del trabajo que ya podría haberse realizado en este campo del procesamiento del lenguaje natural.