Weka Text Майнинг Наивный Байес - PullRequest
0 голосов
/ 05 сентября 2018

У меня вопрос по Textmining в Weka. Итак, у меня есть 4 разные категории. И я хочу, чтобы данные были классифицированы по этим категориям. Кроме того, я хочу, чтобы данные были предсказаны, являются ли они положительными / отрицательными или нейтральными. Итак, вот мои тренировочные данные перед использованием любого фильтра:

@relation QueryResult

@attribute class {Qualität,Bord,Kite,Harness}
@attribute text {evo,foil,end,fin,edg}

@data
Qualität,evo
Bord,foil
Kite,end
Harness,fin
Qualität,edg

Это мой код Java:

 Instances train = new Instances(loadInstancesForWeka("root","",sqlCommand));
 train.setClassIndex(train.numAttributes() - 2);

 NominalToString filter1 = new NominalToString();
 filter1.setInputFormat(train);
 train = Filter.useFilter(train, filter1);


 //filter
 StringToWordVector filter = new StringToWordVector(); 
 filter.setInputFormat(train);
 train = Filter.useFilter(train, filter);

// test2 are the testing instances
     naive.buildClassifier(train);
     for (int i = 0; i < test2.numInstances(); i++) {
                double index = naive.classifyInstance(test2.instance(i));
    }

Итак, мои данные теперь подразделяются на четыре категории: Qualität, Bord, Kite, Harness. Как теперь я могу использовать наивные байесовские алгоритмы, чтобы классифицировать их также как положительные / отрицательные / нейтральные?

...