Пару лет назад предыдущий разработчик из моей команды написал следующий код Python, называющий word2vec, передавая обучающий файл и местоположение выходного файла.Он работал на Linux.Меня попросили запустить это на машине с Windows.Имея в виду Я знаю, что рядом с Python нет , я установил Gensim, который, как я предполагаю, теперь реализует word2vec, но не знаю, как переписать код, чтобы использовать библиотеку, а не исполняемый файл, который ему не кажетсяможно скомпилировать на коробке Windows.Может ли кто-нибудь помочь мне обновить этот код, пожалуйста?
#!/usr/bin/env python3
import os
import csv
import subprocess
import shutil
from gensim.models import word2vec
def train_word2vec(trainFile, output):
# run word2vec:
subprocess.run(["word2vec", "-train", trainFile, "-output", output,
"-cbow", "0", "-window", "10", "-size", "100"],
shell=False)
# Remove some invalid unicode:
with open(output, 'rb') as input_,\
open('%s.new' % output, 'w') as new_output:
for line in input_:
try:
print(line.decode('utf-8'), file=new_output, end='')
except UnicodeDecodeError:
print(line)
pass
shutil.move('%s.new' % output, output)
def main():
train_word2vec("c:/temp/wc/test1_BigF.txt", "c:/temp/wc/test1_w2v_model.txt")
if __name__ == '__main__':
main()