Модель тензорного потока: в чем разница между .data-00000-of-00002 и data-00001-of-00002? - PullRequest
1 голос
/ 10 октября 2019

При хранении тензорного потока ckpt, кроме файлов .index, .meta и checkpoint, одновременно сохраняются два файла ".data": .data-00000-of-00002 и .data-00001-of-00002. Размер первых намного меньше, чем у последних. У меня вопрос, почему сохраняются два файла данных и в чем разница между ними?

1 Ответ

1 голос
/ 10 октября 2019

Согласно официальному тензорному потоку страница : один или несколько шардов (<prefix>-<global_step>.data-<shard_index>-of-<number_of_shards>) содержат веса модели, а индексный файл содержит данные о том, какие веса хранятся в каком шарде. Количество осколков зависит от того, сколько машин вы используете для обучения.

Поэтому, если вы тренируете модель на двух машинах, у вас будет два осколка с суффиксом: .data-00000-of-00002 и .data-00001-of-00002* 1008. *

Вы также можете проверить этот URL .

При создании экземпляра tf.train.Saver вы можете установить значение аргумента sharded (значение по умолчанию False),sharded=True поручает Saver проверять контрольные точки для каждого устройства / устройства.

...