Estoy tratando de eliminar palabras de detención antes de realizar el modelado de temas. Noté que algunas palabras de negación (no, ni, nunca, ninguna, etc.) generalmente se consideran palabras vacías. Por ejemplo, NLTK, spacy y sklearn incluyen "no" en sus listas de palabras de detención. Sin embargo, si eliminamos "no" de estas oraciones a continuación, pierden el significado significativo y eso no sería exacto para el modelado de temas o el análisis de sentimientos.
1). StackOverflow is helpful => StackOverflow helpful
2). StackOverflow is not helpful => StackOverflow helpful
¿Alguien puede explicar por qué estas palabras de negación generalmente se consideran palabras de detención?