Я использую графический интерфейс Weka для классификации текстовых документов.Мой набор данных в формате .arff.
Я применяю фильтр StringToWordVector.Затем я применяю фильтр RemovePercentage, чтобы разделить мой набор данных на поезд и набор тестов.Всего содержит 99 экземпляров и 934 атрибута.После разделения тест-поезда состав поезда содержит 66 экземпляров, а набор испытаний - 33 экземпляра.
Я изучаю модель в наборе поездов: точность равна 100%. Затем я проверяю полученную модель на тестовом наборе.: результат равен 3,0303%.
Может ли кто-нибудь помочь мне понять, почему я получаю 3,0303% и как улучшить этот результат?