Я использую многочленный Наивный Байес, чтобы сортировать документы по трем категориям.Я хотел бы найти наиболее важные «ключевые слова» каждой категории, сродни использованию tf-idf для поиска ключевых слов документа.Я попытался использовать tf-idf для каждого документа в корпусе и получить некоторые общие списки ключевых слов для каждой категории на основе ключевых слов документов в этих категориях, но я не могу найти хороший способ объединить все эти списки ключевых слов.Я также думал о том, чтобы рассматривать каждую категорию как отдельный массивный «документ» и получать ключевые слова, используя tf-idf, но это не дает очень хороших результатов, когда у вас есть только три таких «документа».
Существует ли известный / распространенный метод получения ключевых слов категории?