Странные результаты для NaiveBayes под графическим интерфейсом Weka - PullRequest
1 голос
/ 07 марта 2012

Я использую графический интерфейс Weka для классификации текстовых документов.Мой набор данных в формате .arff.

Я применяю фильтр StringToWordVector.Затем я применяю фильтр RemovePercentage, чтобы разделить мой набор данных на поезд и набор тестов.Всего содержит 99 экземпляров и 934 атрибута.После разделения тест-поезда состав поезда содержит 66 экземпляров, а набор испытаний - 33 экземпляра.

Я изучаю модель в наборе поездов: точность равна 100%. Затем я проверяю полученную модель на тестовом наборе.: результат равен 3,0303%.

Может ли кто-нибудь помочь мне понять, почему я получаю 3,0303% и как улучшить этот результат?

1 Ответ

2 голосов
/ 07 марта 2012

Модель, которую изучает Наивный Байес, оснащена . Чтобы избежать этого, вы можете попробовать различные разделы поезда / теста (или перекрестная проверка ). Вы также можете попробовать настроить параметры наивного байесовского алгоритма или использовать другой.

...