Я получил freebase-vectors-skipgram1000-en.bin.gz от https://code.google.com/archive/p/word2vec/ Затем переименовал его в freebase-vectors-skipgram1000-en.bin и использовал его в своем коде
import gensim.models.keyedvectors as word2vec gvc='freebase-vectors-skipgram1000-en.bin' model=word2vec.KeyedVectors.load_word2vec_format(gvc,binary=True)
Это дает мне эту ошибку
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
Буду благодарен за любую помощь по этому вопросу.
Вместо того, чтобы переименовывать то, что вы скачали, используйте это, чтобы правильно распаковать его:
$ gunzip -v freebase-vectors-skipgram1000-en.bin.gz