Я использую clang для генерации IR LLVM для ядер Nvidia OpenCL и Cuda, которые я хочу впоследствии использовать, делая что-то подобное для OpenCL:
clang -c -x cl -S -emit-llvm -cl-std=CL2.0 kernel.cl -o kernel.ll
и что описано здесь для Cuda.
То, что я ищу, - это способ перейти от инструментированного IR к реальному двоичному файлу. Для случая Cuda я знаю, что могу использовать бэкэнд NVPTX для генерации компиляции PTX и JIT, как описано здесь (или, возможно, использовать ptxas?). Мне было интересно, возможно ли нечто подобное для случая OpenCL, и если да, то, возможно, минимальный пример. Заранее спасибо.