Я создал словарь, который содержит слово и соответствующий ему вектор слов в следующем формате:
{'word1': array([ 4.530e-02, -1.170e-02, -1.201e-01, 2.439e-01, 4.670e-02d], type=float32),
'word2': array([ 4.530e-02, -1.170e-02, -1.201e-01, 2.439e-01, 4.670e-02d], type=float32)}
Я хотел бы сохранить этот словарь в файле custom_embeddings.txt в следующем формате:
Формат вашего файла custom_embeddings.txt должен быть токеном, за которым следуют значения каждого из измерений для встраивания, все разделенные одним пробелом, например, вот два токена с 5-мерным врезанием:
word1 4.530e-02 -1.170e-02 -1.201e-01 2.439e-01 4.670e-02d
word2 4.530e-02 -1.170e-02 -1.201e-01 2.439e-01 4.670e-02d
Будет ли действительно полезно, если вы подскажете, как этого добиться?
Заранее спасибо