Preguntas etiquetadas con nlp

El procesamiento del lenguaje natural (PNL) es un subcampo de la inteligencia artificial que implica transformar o extraer información útil de los datos del lenguaje natural. Los métodos incluyen enfoques basados ​​en reglas y aprendizaje automático.



10
Java Stanford PNL: ¿Parte de las etiquetas de voz?
La PNL de Stanford, que se muestra aquí , ofrece una salida como esta: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. ¿Qué significan las etiquetas Parte de discurso? No puedo encontrar una lista oficial. ¿Es el propio sistema de Stanford, o están usando etiquetas universales? (¿Qué es JJ, por ejemplo?) Además, …

15
Detectando sílabas en una palabra
Necesito encontrar una manera bastante eficiente de detectar sílabas en una palabra. P.ej, Invisible -> in-vi-sib-le Hay algunas reglas de syllabification que podrían usarse: V CV VC CVC CCV CCCV CVCC * donde V es una vocal y C es una consonante. P.ej, Pronunciación (5 Pro-nun-ci-a-tion; CV-CVC-CV-V-CVC) He probado algunos …



11
¿Cómo deshacerse de la puntuación usando el tokenizer NLTK?
Estoy empezando a usar NLTK y no entiendo cómo obtener una lista de palabras del texto. Si lo uso nltk.word_tokenize(), obtengo una lista de palabras y puntuación. Solo necesito las palabras en su lugar. ¿Cómo puedo deshacerme de la puntuación? Tampoco word_tokenizefunciona con varias oraciones: se agregan puntos a la …
125 python  nlp  tokenize  nltk 


2
Java o Python para procesamiento de lenguaje natural [cerrado]
Cerrado . Esta pregunta se basa en opiniones . Actualmente no acepta respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que pueda responderse con hechos y citas editando esta publicación . Cerrado hace 6 años . Mejora esta pregunta Me gustaría saber qué lenguaje de programación es mejor para …
112 java  python  nlp 

21
¿Cómo hago la derivación o lematización de palabras?
Probé PorterStemmer y Snowball, pero ninguno de los dos funciona con todas las palabras y faltan algunas muy comunes. Mis palabras de prueba son: " gatos corriendo corrieron cactus cactus comunidades comunitarias de cactus ", y ambos aciertan menos de la mitad. Ver también: Algoritmo de derivación que produce palabras …


3
¿Cómo entrenar al analizador de Stanford con Genia Corpus?
Tengo algunos problemas para crear un nuevo modelo para Stanford Parser. También descargué la última versión de Stanford: http://nlp.stanford.edu/software/lex-parser.shtml Y aquí, Genia Corpus en 2 formatos, xml y ptb (Penn Treebank). Standford Parser puede entrenar con archivos ptd; luego descargué Genia Corpus, porque quiero trabajar con texto biomédico: http://categorizer.tmit.bme.hu/~illes/genia_ptb/ (el …
93 java  nlp  stanford-nlp 



3
¿Existe una buena biblioteca de procesamiento del lenguaje natural? [Cerrado]
Tal como está actualmente, esta pregunta no se ajusta bien a nuestro formato de preguntas y respuestas. Esperamos que las respuestas estén respaldadas por hechos, referencias o experiencia, pero es probable que esta pregunta solicite debate, argumentos, encuestas o una discusión extensa. Si cree que esta pregunta se puede mejorar …
90 java  nlp 

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.