Объяснение времени процессора и графического процессора с помощью автоградационного профилировщика резака в режиме CUDA - PullRequest
2 голосов
/ 10 мая 2019

Я пытаюсь профилировать сеть с помощью torch.autograd.profiler, и мне нужны некоторые пояснения относительно времени процессора и графического процессора.Я предполагаю, что тайминги почти равны, потому что время процессора включает в себя время запуска ядра + выполнения.Однако я вижу несоответствие при попытке найти взаимосвязь между временем процессора и графического процессора.

Как показано ниже, некоторые операции сообщают примерно в одно и то же время, некоторые операции сообщают, что процессорное время больше, чем время графического процессора, а некоторые имеют время CPU меньше, чем графическое ядро.время.Может кто-нибудь объяснить, пожалуйста, разницу во времени.

  1. OpName CPUTime GPUTime
  2. relu 14.700us 15.936us
  3. sub 112.447us 93.504us
  4. мм43,501US 46,912US
  5. CatBackward 84,912us 84,704us

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...