Как настроить производительность компилятора ROCm (llvm)? - PullRequest
0 голосов
/ 05 сентября 2018

Я немного изменил llvm (roc-1.6.x), чтобы сгенерировать код, который может работать на AMDGPU pro dirver. Он может работать, но производительность на 10% ниже, чем у онлайн-компилятора AMDGPU, для того же кода opencl. Интересно, есть ли какие-нибудь флаги, которые я могу установить, чтобы настроить llvm. Если вы можете дать мне несколько примеров, это будет здорово.

...