Ну, вам нужно проверить, какой метод соответствует вашим потребностям. Но я думаю, что Берт, скорее всего, будет лучше. Недостаток берта в том, что он дороже. Поэтому, если ваша задача чувствительна ко времени, вы должны сбалансировать скорость с точностью.
Также обратите внимание, что bert предварительно обучен, так что вы, вероятно, получите хорошие результаты всего с несколькими тысячами выборок для тонкой настройки. С другой стороны, нет хорошей предварительно подготовленной модели doc2ve c, поэтому вы должны обучить ее самостоятельно, а затем обучить классификатор с этими векторами документов. посмотрите также, например, fastSent или InferSent .