Могу ли я контролировать конфигурацию HSA, созданную бэкэндом AMDGPU? - PullRequest
0 голосов
/ 31 августа 2018

Я использую llvm clang для автономной компиляции моего кода opencl в сборку. Моя цель - амдгпу - амдха. Файл сборки, сгенерированный clang, имеет конфигурацию «enable_sgpr_dispatch_ptr = 1». Можно ли что-то сделать, чтобы отключить это в сгенерированном файле сборки? Кроме того, похоже, что порядок аргументов ядра находится в обратном порядке соглашения AMDCL2. т.е. пользовательский аргумент помещается на первое место, в то время как скрытые аргументы, такие как "HiddenGlobalOffsetX", размещаются после пользовательских аргументов. Могу ли я изменить порядок аргументов, чтобы первым аргументом были скрытые аргументы перед пользовательскими аргументами?

...