as_download()
загружает данные в текущий рабочий каталог, который является общей папкой (или большим двоичным объектом, если вы делаете то, что предложил @reznikov). К сожалению, для небольших файлов ни blob, ни общий файловый ресурс не очень производительны (хотя blob намного лучше) - посмотрите этот ответ для некоторых измерений: Дисковый ввод / вывод очень медленный на P100-NC6s-V2
Когда вы монтируете, причина того, что первая эпоха настолько медленная, заключается в том, что предохранитель blob (который используется для монтирования BLOB-объектов) кэширует локальный SSD, поэтому после первой эпохи всена вашем SSD, и вы получаете полную производительность.
Что касается того, почему первая эпоха занимает гораздо больше времени, чем az copy
, я подозреваю, что средство чтения данных используемой вами платформы не передает данные по чтению. Что вы используете?
Вы можете попробовать одну из 2 вещей:
- Монтировать, но в начале работы скопируйте данные из пути монтирования в / tmp и используйтеэто оттуда.
- Если # 1 значительно медленнее, чем
az copy
, не монтируйте. Вместо этого, в начале работы, скопируйте данные в / tmp, используя az copy
.