sklearn Logisti c Regression - Создание прогноза с пользовательским вводом из сторонних данных тестирования - PullRequest
1 голос
/ 25 февраля 2020

Я делаю Logisti c Регрессия с помощью sklearn для предсказания некоторых категорий с учетом некоторых описаний. Вот код на данный момент

    X_Train, X_Test, y_train, y_test = train_test_split(df['description'], df['category'])

    count_vect = CountVectorizer()
    X_Train_counts = count_vect.fit_transform(X_Train)

    tfidf_transformer = TfidfTransformer()
    X_Train_tfidf = tfidf_transformer.fit_transform(X_Train_counts)

    # Fit the logistic regression model
    clf = LogisticRegression(random_state=0, class_weight='balanced', solver='lbfgs', max_iter=1000)
    clf.fit(X_Train_tfidf, y_train)

Чтобы также вручную проверить мои прогнозы, я делаю это

    # Make predictions
    predictions = clf.predict(tfidf_transformer.transform(count_vect.transform(X_Test)))

    print(X_Test.iloc[7])
    print(predictions[7])

Мой вопрос заключается в том, как я могу сделать прогноз на category, дав вручную пользовательский description извне данных тестирования (например, я ввел его вручную)

Если это возможно, есть ли способ получить верхние n категорий предсказаний для этого пользовательского текста?

1 Ответ

1 голос
/ 25 февраля 2020

Вы должны быть в состоянии сделать что-то вроде этого:

your_description = "some text"
vectorized = tfidf_transformer.transform(count_vect.transform([your_description]))
predictions = clf.predict(vectorized.reshape(-1, 1))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...