сохранение word2ve c в текстовом формате - PullRequest
0 голосов
/ 07 апреля 2020

Я пытался сохранить вектор word2ve c как текст, но это не сработало, я получил ошибку, из-за которой я не совсем понимаю, какие дубликаты появляются здесь и что это за "wv", что предлагается. Может быть, кто-то может объяснить это мне. Заранее спасибо

model = Word2Vec(all_words, min_count=3, sg = 1, size = 300 )
model.save_word2vec_format('test_w2v.txt', binary=False)
WARNING:gensim.models.base_any2vec:under 10 jobs per worker: consider setting a smaller `batch_words' for smoother alpha decay
Word2Vec(vocab=20, size=300, alpha=0.025)
Traceback (most recent call last):
  File "/word2vec.py", line 26, in <module>
    model.save_word2vec_format('test_w2v.txt', binary=False)
  File "/word2vec.py", line 1307, in save_word2vec_format
    raise DeprecationWarning("Deprecated. Use model.wv.save_word2vec_format instead.")
DeprecationWarning: Deprecated. Use model.wv.save_word2vec_format instead.

1 Ответ

1 голос
/ 08 апреля 2020

Поскольку .save_word2vec_format() сохраняет только векторы, а не полную модель, его следует использовать только для под-свойства .wv модели. (Это объект, который содержит только векторы.)

Итак, если вы запустите model.wv.save_word2vec_format('test_w2v.txt', binary=False), как рекомендовано в сообщении об ошибке, вы сохраните векторы в текстовом формате.

( Если вам нужно сохранить полную модель, используйте model.save() - она ​​сохранит больше информации и, возможно, будет использовать несколько дополнительных файлов, но будет в формате Python - и gensim-speci c, в отличие от простого текста формат, который могут прочитать другие инструменты.)

...