Я делаю Logisti c Регрессия с помощью sklearn для предсказания некоторых категорий с учетом некоторых описаний. Вот код на данный момент
X_Train, X_Test, y_train, y_test = train_test_split(df['description'], df['category'])
count_vect = CountVectorizer()
X_Train_counts = count_vect.fit_transform(X_Train)
tfidf_transformer = TfidfTransformer()
X_Train_tfidf = tfidf_transformer.fit_transform(X_Train_counts)
# Fit the logistic regression model
clf = LogisticRegression(random_state=0, class_weight='balanced', solver='lbfgs', max_iter=1000)
clf.fit(X_Train_tfidf, y_train)
Чтобы также вручную проверить мои прогнозы, я делаю это
# Make predictions
predictions = clf.predict(tfidf_transformer.transform(count_vect.transform(X_Test)))
print(X_Test.iloc[7])
print(predictions[7])
Мой вопрос заключается в том, как я могу сделать прогноз на category
, дав вручную пользовательский description
извне данных тестирования (например, я ввел его вручную)
Если это возможно, есть ли способ получить верхние n категорий предсказаний для этого пользовательского текста?