тот же код, но с разными результатами профилирования от tfprof - PullRequest
0 голосов
/ 23 сентября 2018

Я использую tfprof в качестве инструмента профилирования для профилирования программы Python с тензорным потоком.

Я получаю результат профиля о запрошенных байтах на моем Macbook, но когда я делаю то же самое на рабочей станции Linux (с графическим процессором), запрошенные байты в 4 раза больше, чем на моем ноутбуке.

Сначала я думаю, что это, вероятно, потому, что GPU фактически выделит больше памяти, чем необходимо для уменьшения фрагментации.Но когда я отключил графический процессор (т.е. позволил CUDA_VISIBLE_DEVICES = '' ) и перезапустил программу, запрошенные байты все еще в 4 раза больше, чем у моего ноутбука.
(я проверил, что версия python (3.6) и Tensorflow (r1.5) одинаковы в обеих средах, но тензор потока на моем ноутбуке только для процессора.)

Кто-нибудь знает причину?
Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...