Я (полный noob в машинном обучении и обработке естественного языка) использую подход doc2ve c (библиотека gensim python), чтобы найти наиболее похожий документ на случайную строку. Проблема в том, что всякий раз, когда я хотел бы добавить новый документ к обученной модели, мне нужно переучивать модель с нуля.
Есть ли подход, который отличается способностью добавлять новый документ / словарь к обученной модели без необходимости тренироваться с нуля или подходом, который бы обучался быстрее?
Я перегружены всеми подходами к nlp и начались только с того, что я нашел самым популярным (word2vec / doc2ve c), и теперь я ищу направление, где учиться сейчас. Спасибо за любые рекомендации.