У меня вопрос по Textmining в Weka. Итак, у меня есть 4 разные категории. И я хочу, чтобы данные были классифицированы по этим категориям. Кроме того, я хочу, чтобы данные были предсказаны, являются ли они положительными / отрицательными или нейтральными.
Итак, вот мои тренировочные данные перед использованием любого фильтра:
@relation QueryResult
@attribute class {Qualität,Bord,Kite,Harness}
@attribute text {evo,foil,end,fin,edg}
@data
Qualität,evo
Bord,foil
Kite,end
Harness,fin
Qualität,edg
Это мой код Java:
Instances train = new Instances(loadInstancesForWeka("root","",sqlCommand));
train.setClassIndex(train.numAttributes() - 2);
NominalToString filter1 = new NominalToString();
filter1.setInputFormat(train);
train = Filter.useFilter(train, filter1);
//filter
StringToWordVector filter = new StringToWordVector();
filter.setInputFormat(train);
train = Filter.useFilter(train, filter);
// test2 are the testing instances
naive.buildClassifier(train);
for (int i = 0; i < test2.numInstances(); i++) {
double index = naive.classifyInstance(test2.instance(i));
}
Итак, мои данные теперь подразделяются на четыре категории: Qualität, Bord, Kite, Harness.
Как теперь я могу использовать наивные байесовские алгоритмы, чтобы классифицировать их также как положительные / отрицательные / нейтральные?