Странная обработка в Dataloader с разными параметрами для num_workers - PullRequest
0 голосов
/ 11 июня 2019

Процесс обучения очень странный.Часть загрузки данных будет стоить много времени для определенного шага, а для следующих нескольких шагов это будет очень быстро.Эта процедура повторяется снова и снова в соответствии с параметром num_workers.Это нормально?Или есть какой-либо метод, похожий на tenorflow prefech() part?

Среда: Pytorch, Ubuntu16.04, существует проблема при использовании 1 GPU / 2 GPU

_NUM_WORKERS = 8
train_loader = DataLoader(
      trainset,
      batch_size=config.batch_size,
      shuffle=True,
      num_workers=_NUM_WORKERS,
      pin_memory=True)

Когда _NUM_WORKERS = 8

% Time format: time for this step (average time per step) 
Epoch: [0][1/4642]      Time 8.363 (8.363) <--- look at here
Epoch: [0][2/4642]      Time 0.557 (4.460)
Epoch: [0][3/4642]      Time 0.564 (3.161)
Epoch: [0][4/4642]      Time 0.562 (2.512)
Epoch: [0][5/4642]      Time 0.560 (2.121)
Epoch: [0][6/4642]      Time 0.569 (1.863)
Epoch: [0][7/4642]      Time 0.565 (1.677)
Epoch: [0][8/4642]      Time 0.573 (1.539)
Epoch: [0][9/4642]      Time 3.031 (1.705) <--- look at here
Epoch: [0][10/4642]     Time 0.569 (1.591)
Epoch: [0][11/4642]     Time 0.574 (1.499)
Epoch: [0][12/4642]     Time 0.565 (1.421)
Epoch: [0][13/4642]     Time 0.562 (1.355)
Epoch: [0][14/4642]     Time 0.570 (1.299)
Epoch: [0][15/4642]     Time 0.566 (1.250)
Epoch: [0][16/4642]     Time 0.560 (1.207)
Epoch: [0][17/4642]     Time 2.543 (1.286) <--- look at here

Когда _NUM_WORKERS = 8

% Time format: time for this step (average time per step) 
Epoch: [0][1/4642]      Time 5.997 (5.997) <--- look at here
Epoch: [0][2/4642]      Time 0.554 (3.275)
Epoch: [0][3/4642]      Time 0.554 (2.368)
Epoch: [0][4/4642]      Time 0.569 (1.918)
Epoch: [0][5/4642]      Time 3.803 (2.295) <--- look at here
Epoch: [0][6/4642]      Time 0.566 (2.007)
Epoch: [0][7/4642]      Time 0.561 (1.801)
Epoch: [0][8/4642]      Time 0.565 (1.646)
Epoch: [0][9/4642]      Time 5.011 (2.020) <--- look at here

Я думаю, что идеальная процедура состоит в том, что каждый шаг должен стоить одинаковое время.Это возможно в pytorch?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...