Наивные байесовские категории ключевые слова - PullRequest
0 голосов
/ 22 ноября 2018

Я использую многочленный Наивный Байес, чтобы сортировать документы по трем категориям.Я хотел бы найти наиболее важные «ключевые слова» каждой категории, сродни использованию tf-idf для поиска ключевых слов документа.Я попытался использовать tf-idf для каждого документа в корпусе и получить некоторые общие списки ключевых слов для каждой категории на основе ключевых слов документов в этих категориях, но я не могу найти хороший способ объединить все эти списки ключевых слов.Я также думал о том, чтобы рассматривать каждую категорию как отдельный массивный «документ» и получать ключевые слова, используя tf-idf, но это не дает очень хороших результатов, когда у вас есть только три таких «документа».

Существует ли известный / распространенный метод получения ключевых слов категории?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...