Ниже приведен метод most_inforrative_feature_for_binary_classification:
def most_informative_feature_for_binary_classification(vectorizer, classifier, n=100):
"""
Identify most important features if given a vectorizer and binary classifier. Set n to the number
of weighted features you would like to show.
"""
# additional stopwords to be remove
# Open a file and read it into memory
file = open('..\stopwords.txt')
additional_stopwords = file.read()
additional_stopwords = additional_stopwords.split()
class_labels = classifier.classes_
feature_names = vectorizer.get_feature_names()
feature_names = [word for word in feature_names if word not in additional_stopwords]
topn_class1 = sorted(zip(classifier.coef_[0], feature_names))[:n]
topn_class2 = sorted(zip(classifier.coef_[0], feature_names))[-n:]
# class_labels = category
# coef = co-effecient
# feat = most informative feature
for coef, feat in topn_class1:
print(class_labels[0], coef, feat)
print()
for coef, feat in reversed(topn_class2):
print(class_labels[1], coef, feat)
В настоящее время я могу печатать только для двух категорий, как показано выше в цикле 2 for ...
Но я хочу получить 2различные категории каждый раз, когда программа запускается ... Например, 1-й раз, когда программа запускается -> выходные данные будут классом 3 и 4, 2-й раз, когда программа будет выполняться, класс 4 и 5, 3-й раз программа запускается: класс 5 и 6, 4-йпрограмма времени работает: класс 6 и 7 программа времени 5 запускается: класс 7 и 8 и что она снова пройдет этот цикл
Пожалуйста, помогите мне взглянуть на мои коды: ((