Как преобразовать модель t5 в .h5 или .bin из .ckpt в пакете трансформаторов - PullRequest
0 голосов
/ 22 апреля 2020

Я следую указаниям, приведенным на странице github для трансформаторов, для краткого изложения здесь: https://github.com/huggingface/transformers/tree/master/examples/summarization/t5

Как уже упоминалось, используя скрипт в папке BART, я смог для точной настройки модели t5 с помощью t5-base она сохраняет файл .ckpt, но на основании их документации нам понадобятся .index и другие файлы для загрузки файла контрольных точек, но я не могу найти его где-либо.

Пробные решения:

  • У них есть скрипт преобразования (transformer-cli), который не имеет конфигурации t5 для преобразования его в файл pytorch с помощью всего лишь ckpt.

  • Попытка создания конфигурации и базовой модели, а затем загрузка файла контрольных точек дает тензор потока. python .framework.errors_impl.DataLossError: Невозможно открыть файл таблицы ./t5_model.ckpt: Потеря данных: не sstable (плохое число c): возможно, ваш файл находится в другом формате, и вам нужно использовать другой оператор восстановления?

config = transformers.T5Config.from_json_file(json_file)
model = transformers.TFT5Model(config)
transformers.load_tf_weights_in_t5(model,config,"./t5_model.ckpt")

I Предполагается, что файл .ckpt поврежден, поэтому в файле https://github.com/huggingface/transformers/blob/master/examples/summarization/bart/finetune.py есть возможность предсказать, загрузив файл контрольных точек, в том, что он работает.

Так что я не конечно, где я ошибаюсь или как экспортировать модель в .h5 или .bin, даже справки с загрузкой весов будет достаточно.

Заранее спасибо.

...