Можно ли обновить Doc2Ve c Vector? - PullRequest
1 голос
/ 19 февраля 2020

Я работаю с постоянно растущим корпусом. Я обучаю свой Vector Vector с помощью Doc2Ve c, который реализован в Python.

Можно ли обновить вектор документа?

Я хочу использовать вектор документа для рекомендаций документа.

1 Ответ

0 голосов
/ 20 февраля 2020

Отдельные векторы могут быть обновлены, но класс модели gensim Doc2Vec не имеет большой поддержки для добавления дополнительных do c -векторов к себе.

Однако он может возвращать отдельные векторы для новых текстов, которые совместимы (сопоставимы) с существующими векторами, с помощью метода .infer_vector(words). Вы можете сохранить эти векторы в ваших собственных структурах данных для поиска.

Когда поступит достаточно новых документов, которые, по вашему мнению, будут лучше для вашей базовой модели, при обучении всем документам вы можете переобучить модель со всеми доступными данными, используя ее в качестве новой базы для .infer_vector() , (Обратите внимание, что векторы из переобученной модели обычно не будут совместимы / сопоставимы с векторами из предыдущей модели: каждая тренировка загружает отдельное самосогласованное координатное пространство.)

...