Я пытаюсь профилировать сеть с помощью torch.autograd.profiler, и мне нужны некоторые пояснения относительно времени процессора и графического процессора.Я предполагаю, что тайминги почти равны, потому что время процессора включает в себя время запуска ядра + выполнения.Однако я вижу несоответствие при попытке найти взаимосвязь между временем процессора и графического процессора.
Как показано ниже, некоторые операции сообщают примерно в одно и то же время, некоторые операции сообщают, что процессорное время больше, чем время графического процессора, а некоторые имеют время CPU меньше, чем графическое ядро.время.Может кто-нибудь объяснить, пожалуйста, разницу во времени.
- OpName CPUTime GPUTime
- relu 14.700us 15.936us
- sub 112.447us 93.504us
- мм43,501US 46,912US
- CatBackward 84,912us 84,704us
Спасибо