Приводит ли TensorFlow к низкой производительности при обучении модели NeuMF на нескольких машинах? - PullRequest
0 голосов
/ 14 декабря 2018

Модель NeuMF используется в системе рекомендаций, и я получаю версию этой модели с тензорным потоком в репо моделей тензорного потока.Я обучил модель со стратегией PS и Mirror в одном процессе с 1 графическим процессором и 4 графическими процессорами, 2 процесса на разных компьютерах, каждый процесс имеет 4 графических процессора, в результате:
1. производительность 1 процесса с 4 графическими процессорами значительно вышемедленнее, чем 1 GPU со стратегией PS.
2. производительность 1 процесса с 4 GPU в три раза выше, чем 1 GPU со стратегией Mirror.
3. производительность 2 процессов с 8 GPU почти такая же, как 1 процесс с4 GPU со стратегией Mirror.

Я очень озадачен результатами 1 и 3, и я обнаружил, что tf.nn.embedding вызывает много копий памяти между CPU и GPU со стратегией PS и копией памяти междуGPU и GPU с зеркальной стратегией.Приводит ли tf.nn.embedding к запутанным результатам 1 и 3?

...