Я видел только несколько вопросов, которые задают этот вопрос, и ни на один из них еще нет ответа, поэтому я подумал, что можно попробовать.Я использовал модель word2vec от gensim для создания некоторых векторов.Я экспортировал их в текст и попытался импортировать их на живую модель встраиваемого проектора tenorflow.Одна проблема. Это не сработало .Он сказал мне, что тензоры были неправильно отформатированы.Поэтому, будучи новичком, я решил спросить некоторых людей с большим опытом о возможных решениях.
Эквивалент моего кода:
import gensim
corpus = [["words","in","sentence","one"],["words","in","sentence","two"]]
model = gensim.models.Word2Vec(iter = 5,size = 64)
model.build_vocab(corpus)
# save memory
vectors = model.wv
del model
vectors.save_word2vec_format("vect.txt",binary = False)
Это создает модель, сохраняет векторы, а затем печатаеткрасиво и красиво получается в файле с разделителями табуляции со значениями для всех измерений.Я понимаю, как делать то, что я делаю, я просто не могу понять, что не так с тем, как я это делаю в тензорном потоке, поскольку, насколько я могу судить, документации по этому вопросу довольно мало.
Одна идея, котораяМне представили, реализует соответствующий код тензорного потока, но я не знаю, как это кодировать, просто импортировать файлы в живой демонстрации.
Редактировать: у меня сейчас новая проблема.Объект, в котором находятся мои векторы, не повторяется, потому что gensim, очевидно, решил создать свои собственные структуры данных, несовместимые с тем, что я пытаюсь сделать.
Хорошо.С этим тоже покончено!Спасибо за вашу помощь!