Я предсказываю сходство документов, используя предварительно обученные пространственные вложения слов. Поскольку у меня много слов, специфичных для домена, c, я хочу точно настроить свои векторы на довольно небольшом наборе данных, содержащем мой словарь c, специфицированный для домена.
Моя идея заключалась в том, чтобы просто обучить просторную модель снова с моими данными. Но поскольку векторы слов в spacy встроены, я не знаю, как это сделать. Есть ли способ снова обучить пространственную модель с моими данными?
После некоторого исследования я обнаружил, что могу обучать собственные векторы с помощью Gensim. Там мне пришлось бы загрузить предварительно обученную модель, например, модель набора данных Google News, а затем я мог бы снова обучить ее с моим набором данных. Это единственный способ? Или есть способ продолжить работу с моей просторной моделью?
Любая помощь приветствуется.