Есть много способов, но они зависят от классификатора.Поскольку вы пометили это nltk
, я предполагаю, что вы используете классификаторы nltk.Допустим, вы обучили NaiveBayesClassifier
заданию по классификации.У обученного классификатора есть метод most_informative_features()
, который покажет вам особенности (слова) с наибольшей корреляцией с какой-либо категорией.Вы можете попросить показать столько функций, сколько вам нужно.
Если память служит, несколько классификаторов nltk имеют эквивалентные методы;но вам придется искать те, которые вы используете.В более общем смысле вы можете изучить внутренние таблицы любого классификатора и изучить код, чтобы понять, что означают числа.(Это очень поможет, если вы поймете алгоритм, прежде чем смотреть на код.)