¿Cómo uso un filtro de palabras clave personalizado en la API Java Weka?


8

Estoy usando la API Java Weka para construir un modelo de clasificación. Puedo usar el filtro incorporado de palabras clave. Sin embargo, necesito usar un filtro personalizado para mi problema. No sé cómo usar un filtro de palabras clave personalizado en la API Java Weka.

Respuestas:


7

Puedes probar el siguiente código.

import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.unsupervised.attribute.StringToWordVector;
import weka.core.Instances;

Instances data = DataSource.read(".../document.txt"); //Your document .
filter.setInputFormat(data);
StringToWordVector filter = new StringToWordVector();
filter.setStopwords(new File(".../stopwords.txt")); //stop words file.
Instances data = Filter.useFilter(data,filter);

También puede leer el siguiente documento para comprender mejor la API de Weka para Java. http://weka.sourceforge.net/doc.stable/


Aprecio tu apoyo. Muchas gracias. Su código y el enlace del documento realmente me ayudan mucho.
Radia Karim

7

En primer lugar, debe preparar un archivo de texto para sus palabras clave personalizadas. Entonces puedes usar el siguiente código:

import weka.filters.unsupervised.attribute.StringToWordVector;

StringToWordVector filter = new StringToWordVector(10000);
filter.setStopwords(new File(".../stopwords.txt"));

Espero que te ayude.


Aprecio tu apoyo.
Radia Karim

Soy muy nuevo en la programación Java weka-api. No lo entiendo claramente. Alguien, por favor, dame una respuesta un poco más elaborada. Gracias de antemano por su apoyo.
Radia Karim

Por favor, háganos saber qué parte no entiende?
Rejaul Karim
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.