Я пытаюсь выполнить некоторую классификацию текста, используя машинное обучение, и для этого я извлек векторы признаков из обработанных текстовых данных, используя простой подход к пакету слов (count vectorizer) и tfidf vectorizer.
Теперь я хочу использовать word2vec, т. Е. Вложение слов в качестве моего векторного признака, аналогичного векторизатору счетчиков / векторизаторов tfidf, где я должен иметь возможность изучать словарный запас из данных поезда и преобразовывать или сопоставлять тестовые данные с изученнымно я не могу найти способ реализовать это.
//I need something like this with word2vec
count = CountVectorizer()
train_feature_ vector =count.fit_transform(train_data)
test_feature_vector = count.fit(test_data)
//So I can train my model like this
mb = MultinomialNB()
mb.fit(train_feature_vector,y_train)
acc_score = mb.score(test_feature_vector,y_test)
print("Accuracy "+str(acc_score))