У меня есть вопрос, связанный с gensim.Мне нравится знать, рекомендуется или необходимо использовать pickle при сохранении или загрузке модели (или нескольких моделей), так как я нахожу скрипты на GitHub, которые это делают.
mymodel = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)
mymodel.delete_temporary_training_data(keep_doctags_vectors=True, keep_inference=True)
См. здесь
Вариант 1:
import pickle
# Save
mymodel.save("mymodel.pkl") # Stores *.pkl file
# Load
mymodel = pickle.load("mymodel.pkl")
Вариант 2:
# Save
model.save(mymodel) # Stores *.model file
# Load
model = Doc2Vec.load(mymodel)
В gensim.utils
мне кажется, что есть встроенная функция pickle: https://github.com/RaRe-Technologies/gensim/blob/develop/gensim/utils.py
def save ... try: _pickle.dump (self, fname_or_handle,protocol = pickle_protocol) ...
Цель моего вопроса: Я был бы рад узнать 1) нужен ли мне pickle (для лучшего управления памятью) и 2) в случае, почему этолучше, чем загрузка файлов * .model.
Спасибо!