Компиляция CUDA или OpenCL для llvm IR - PullRequest
2 голосов
/ 09 января 2012

Clang может перевести CUDA (не завершено) или OpenCL в llvm.Как он может сохранить ключевое слово «shared», чтобы знать разницу между разделяемой и глобальной памятью?

1 Ответ

0 голосов
/ 09 января 2012

Я не знаком с CUDA или OpenCL, но могу посоветовать вам взглянуть на итоговый IR LLVM, сгенерированный внешним интерфейсом, и посмотреть, какой код генерируется. Также вы можете посмотреть на соответствующий сервер LLVM, чтобы увидеть, как он использует общую / глобальную память.

...