Являются ли точечные продукты быстрее, чем инструкции MAD (умножение и сложение) в графических процессорах Arm Mali? - PullRequest
0 голосов
/ 25 октября 2019

Я обнаружил, что скалярное произведение - это тот же цикл с векторным сложением, векторным множителем (всего один цикл на АЛУ на ядро), но не безумный. Так что мне любопытно, сколько циклов безумных инструкций.

1 Ответ

0 голосов
/ 25 октября 2019

Я прибегаю к точечному продукту, чтобы улучшить производительность OpenCL вместо безумного, но у меня плохая производительность. В случае с mad время выполнения ядра в моем проекте составляет 58 мс (среднее, многократное тестирование, на руке Gli Bifrost). И 68мс с точечным произведением. Поэтому, если у вас есть другое заключение, пожалуйста, приложите его.

...