Я точно настроил модель BERT с предварительной подготовкой в Pytorch, используя трансформатор с обнимающим лицом. Все обучение / проверка выполняется на графическом процессоре в облаке.
В конце обучения я сохраняю модель и токенизатор, как показано ниже:
best_model.save_pretrained('./saved_model/')
tokenizer.save_pretrained('./saved_model/')
Это создает следующие файлы в каталоге saved_model
:
config.json
added_token.json
special_tokens_map.json
tokenizer_config.json
vocab.txt
pytorch_model.bin
Теперь я загружаю каталог saved_model
на свой компьютер и хочу загрузить модель и токенизатор. Я могу загрузить модель, как показано ниже:
model = torch.load('./saved_model/pytorch_model.bin',map_location=torch.device('cpu'))
Но как мне загрузить токенизатор? Я новичок в Pytorch и не уверен, потому что есть несколько файлов. Возможно, я неправильно сохраняю модель?
Пожалуйста, предложите.