Doc2Vec против Avg Word Векторы: что лучше для анализа настроений? - PullRequest
0 голосов
/ 25 декабря 2018

Я выполнял анализ настроений для набора данных IMdb в Kaggle.Я использовал метод BOW с биграммами, и это дало мне приличную точность ~ 89%.Но я не знаю, как подойти к тому же, используя вложения слов: я должен пойти на усредненные векторы слов или doc2vec?

Кто-то, пожалуйста, помогите.Заранее спасибо.

1 Ответ

0 голосов
/ 26 декабря 2018

Вот недавнее сообщение в блоге , сравнивающее усреднение word2vec и производительность doc2vec.Пост одобряет doc2vec.Это также зависит от того, какую модель классификации вы используете (логистическая регрессия, SVM, LSTM и т. Д.)

...