Загрузите Freebase используя python - PullRequest
0 голосов
/ 08 декабря 2018

Я получил freebase-vectors-skipgram1000-en.bin.gz от https://code.google.com/archive/p/word2vec/ Затем переименовал его в freebase-vectors-skipgram1000-en.bin и использовал его в своем коде

import gensim.models.keyedvectors as word2vec
gvc='freebase-vectors-skipgram1000-en.bin'
model=word2vec.KeyedVectors.load_word2vec_format(gvc,binary=True)

Это дает мне эту ошибку

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

Буду благодарен за любую помощь по этому вопросу.

1 Ответ

0 голосов
/ 08 декабря 2018

Вместо того, чтобы переименовывать то, что вы скачали, используйте это, чтобы правильно распаковать его:

$ gunzip -v freebase-vectors-skipgram1000-en.bin.gz
...