Здравствуйте, у меня есть несколько моделей word2vec, сгенерированных с использованием Java-реализации Word2Vec в DL4J и сохраненных с помощью вызова
writeWord2VecModel(Word2Vec vectors, String path)
Выходные данные - это zip-файл, содержащий несколько текстовых файлов.,Я могу успешно загрузить и использовать модель в DL4j, используя
Word2Vec readWord2VecModel(String path)
. Я сейчас пытаюсь прочитать эту модель в Python, используя gensim
import gensim
model = gensim.models.KeyedVectors.load_word2vec_format('file_path, binary=False)
Но я получаю следующую ошибку:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe0 in position 10: invalid continuation byte
Я также пробовал с двоичным = True и получаю те же результаты.
Если я извлекаю модель, сгенерированную DL4J, я получаю следующие файлы:
Есть ли способ прочитать эту модель в python genism
?