Добавление прохода оптимизации для AMD OpenCL отличается от записи прохода LLVM, как в Написание прохода LLVM .Какие дополнительные знания я должен иметь, чтобы достичь этого?Нужны ли нам дополнительные библиотеки для оптимизации ядра OpenCL?
Я получил ответ на этот вопрос в AMD Forums (обновил ссылку)