Question

Я использую графический интерфейс Weka для классификации текстовых документов.Мой набор данных в формате .arff.

Я применяю фильтр StringToWordVector.Затем я применяю фильтр RemovePercentage, чтобы разделить мой набор данных на поезд и набор тестов.Всего содержит 99 экземпляров и 934 атрибута.После разделения тест-поезда состав поезда содержит 66 экземпляров, а набор испытаний - 33 экземпляра.

Я изучаю модель в наборе поездов: точность равна 100%. Затем я проверяю полученную модель на тестовом наборе.: результат равен 3,0303%.

Может ли кто-нибудь помочь мне понять, почему я получаю 3,0303% и как улучшить этот результат?

Lars Kotthoff · Answer 1 · 07 марта 2012

Модель, которую изучает Наивный Байес, оснащена . Чтобы избежать этого, вы можете попробовать различные разделы поезда / теста (или перекрестная проверка ). Вы также можете попробовать настроить параметры наивного байесовского алгоритма или использовать другой.

Странные результаты для NaiveBayes под графическим интерфейсом Weka

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Странные результаты для NaiveBayes под графическим интерфейсом Weka

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы