Я проводил несколько экспериментов с Intel Advisor 2020 и, в частности, с моделью линии крыши. Я не могу понять, почему пиковая производительность скалярных целых чисел (intop / cycle) отличается от теоретической, которую я ожидал, тем более что все другие показатели соответствуют более или менее (производительность векторных целых чисел, с плавающей запятой ..)
В частности, согласно Intel Advisor максимальная пиковая производительность (для добавления) составляет около 2,3 целочисленных операций за цикл, в то время как теоретическое значение, которое я ожидал бы найти, составляет 4 IntP / цикл, поскольку у нас есть 4 INT ALU в 4 разных портах.
Я что-то упускаю?