Как сохранить пользовательскую матрицу встраивания в файл формата .txt? - PullRequest
0 голосов
/ 30 апреля 2020

Я создал словарь, который содержит слово и соответствующий ему вектор слов в следующем формате:

{'word1': array([ 4.530e-02, -1.170e-02, -1.201e-01,  2.439e-01,  4.670e-02d], type=float32),
'word2': array([ 4.530e-02, -1.170e-02, -1.201e-01,  2.439e-01,  4.670e-02d], type=float32)}

Я хотел бы сохранить этот словарь в файле custom_embeddings.txt в следующем формате:

Формат вашего файла custom_embeddings.txt должен быть токеном, за которым следуют значения каждого из измерений для встраивания, все разделенные одним пробелом, например, вот два токена с 5-мерным врезанием:

word1 4.530e-02 -1.170e-02 -1.201e-01  2.439e-01  4.670e-02d
word2 4.530e-02 -1.170e-02 -1.201e-01  2.439e-01  4.670e-02d

Будет ли действительно полезно, если вы подскажете, как этого добиться?

Заранее спасибо

1 Ответ

1 голос
/ 30 апреля 2020

Python s .items () вызов - это элегантный способ l oop по всем словам в вашем словаре. Это сохранит вывод в виде строк текстового файла:

txt_filename = 'output.txt'

with open(txt_filename, 'w') as f:
    for word, vec in my_wordvec_dict.items():
        f.write('{} {}\n'.format(word, ' '.join(['{:e}'.format(item) for item in vec])))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...