Есть ли способ автоматического преобразования кода, который был написан для выполнения вычислений FP32 на GPU FP32, чтобы он всегда мог выполнять вычисления FP16 вместо FP32?
То, что я пытаюсь достичь, этозапустить код для старого графического процессора (который не поддерживает тип HALF), запустить на более новом графическом процессоре, который работает ... но сам не проходит через код ...
Если это невозможно, показатьмне немного света о том, какую документацию мне следует прочитать, чтобы сделать это самому ...
(новый графический процессор - Radeon Vega Frontier, драйвер - ROCm 1.9.1, ОС - Ubuntu 18.04) (код обширный исоставленный из разных модулей ... поэтому я не буду публиковать его здесь, если не попросят)