у меня есть набор данных с двумя столбцами пользовательских сообщений (сообщений) и типа личности (типа), мне нужен тип личности в соответствии с сообщениями, использующими этот набор данных, поэтому я использовал случайную регрессию леса для прогнозирования
вот мой код: -
df = pd.read_csv('personality_types.csv')
count_vectorizer = CountVectorizer(decode_error='ignore')
X = count_vectorizer.fit_transform(df['posts'])
y = df['type'].values
Xtrain, Xtest, Ytrain, Ytest = train_test_split(X, y, test_size=0.33)
random_forest = RandomForestClassifier(n_estimators=100)
random_forest.fit(Xtrain, Ytrain)
Y_prediction = random_forest.predict(Xtest)
Точность:
random_forest.score(Xtrain, Ytrain)
acc_random_forest = round(random_forest.score(Xtrain, Ytrain) * 100, 2)
print(round(acc_random_forest,2,), "%")
100%
теперь я хочу получить прогноз из пользовательского текста, как мне этого добиться?
как я могу получить индивидуальный тип сообщения отдельно, используя эту модель.