Preguntas etiquetadas con nltk

Natural Language Toolkit es una biblioteca de Python para lingüística computacional.


15
Error al cargar english.pickle con nltk.data.load
Al intentar cargar el punkttokenizer ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a LookupErrorse planteó: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - 'E:\\nltk_data' > - …
144 python  jenkins  nltk 


15
n-gramos en pitón, cuatro, cinco, seis gramos?
Estoy buscando una manera de dividir un texto en n-gramas. Normalmente haría algo como: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Soy consciente de que nltk solo ofrece bigrams y trigrams, pero ¿hay alguna forma de dividir …
137 python  string  nltk  n-gram 



11
¿Cómo deshacerse de la puntuación usando el tokenizer NLTK?
Estoy empezando a usar NLTK y no entiendo cómo obtener una lista de palabras del texto. Si lo uso nltk.word_tokenize(), obtengo una lista de palabras y puntuación. Solo necesito las palabras en su lugar. ¿Cómo puedo deshacerme de la puntuación? Tampoco word_tokenizefunciona con varias oraciones: se agregan puntos a la …
125 python  nlp  tokenize  nltk 

12
Cómo eliminar las palabras vacías usando nltk o python
Así que tengo un conjunto de datos que me gustaría eliminar el uso de palabras vacías stopwords.words('english') Estoy luchando por cómo usar esto dentro de mi código para simplemente eliminar estas palabras. Ya tengo una lista de las palabras de este conjunto de datos, la parte con la que estoy …
110 python  nltk  stop-words 


26
problema de pip al instalar casi cualquier biblioteca
Tengo dificultades para usar pip para instalar casi cualquier cosa. Soy nuevo en la codificación, así que pensé que tal vez esto es algo que he estado haciendo mal y he optado por easy_install para obtener la mayor parte de lo que necesitaba, que generalmente ha funcionado. Sin embargo, ahora …
101 python  pip  nltk  easy-install 

17
Recurso u'tokenizers / punkt / english.pickle 'no encontrado
Mi código: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') Mensaje de error: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load opened_resource = _open(resource_url) File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open return find(path_, path + ['']).open() File "/usr/lib/python2.6/site-packages/nltk/data.py", …
96 python  unix  nltk 




4
Creando un nuevo corpus con NLTK
Calculé que a menudo la respuesta a mi título es ir y leer la documentación, pero revisé el libro NLTK pero no da la respuesta. Soy un poco nuevo en Python. Tengo un montón de .txtarchivos y quiero poder usar las funciones de corpus que NLTK proporciona para el corpus …
83 python  nlp  nltk  corpus 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.