Есть ли способ, которым я могу получить эквивалентный список векторов для абзаца в doc2ve c? - PullRequest
0 голосов
/ 02 мая 2020

Есть ли способ увидеть векторы, которые я получил по абзацам, а не по каждому слову в словаре с помощью doc2ve c. Используя model.wv.vectors, я получаю все векторы на слова. Теперь мне нужно это для того, чтобы применить алгоритм кластеризации для встроенных абзацев, который я надеюсь получить. Хотя я не уверен, что этот подход хорош. Вот как выглядят абзацы:

[TaggedDocument(words=['this', 'is', 'the', 'effect', 'of', 'those', 'states', 'that', 'went', 'into', 'lockdown', 'much', 'later', 'they', 'are', 'just', 'starting', 'to', 'see', 'the', 'large', 'increase', 'now', 'they', 'have', 'to', 'ride', 'it', 'out', 'and', 'hope', 'for', 'the', 'best'], tags=[0])

TaggedDocument(words=['so', 'see', 'the', 'headline', 'is', 'died', 'not', 'revised', 'predictions', 'show', 'more', 'hopeful', 'situation', 'or', 'new', 'york', 'reaching', 'apex', 'long', 'before', 'experts', 'predicted', 'or', 'any', 'such', 'thing', 'got', 'to', 'keep', 'the', 'panic', 'train', 'rolling', 'see'], tags=[1])]

1 Ответ

0 голосов
/ 02 мая 2020

model.docvecs.vectors будет содержать все подготовленные векторы документов.

...