Я использую tfprof в качестве инструмента профилирования для профилирования программы Python с тензорным потоком.
Я получаю результат профиля о запрошенных байтах на моем Macbook, но когда я делаю то же самое на рабочей станции Linux (с графическим процессором), запрошенные байты в 4 раза больше, чем на моем ноутбуке.
Сначала я думаю, что это, вероятно, потому, что GPU фактически выделит больше памяти, чем необходимо для уменьшения фрагментации.Но когда я отключил графический процессор (т.е. позволил CUDA_VISIBLE_DEVICES = '' ) и перезапустил программу, запрошенные байты все еще в 4 раза больше, чем у моего ноутбука.
(я проверил, что версия python (3.6) и Tensorflow (r1.5) одинаковы в обеих средах, но тензор потока на моем ноутбуке только для процессора.)
Кто-нибудь знает причину?
Спасибо.