Я работаю на устройстве с графическим процессором, которое имеет очень большую целочисленную задержку деления, несколько сотен циклов. Я ищу для оптимизации подразделений.
Все деления по знаменателю, который находится в наборе {1,3,6,10}, однако числитель является положительным значением времени выполнения, примерно 32000 или меньше. из-за ограничений памяти таблица поиска может быть не лучшим вариантом.
Можете ли вы придумать альтернативы?
Я думал о вычислении обратных чисел с плавающей точкой и об их использовании для умножения числителя.
Спасибо
PS. спасибо, люди. взломать сдвиг бит это действительно круто.
чтобы восстановить после округления, я использую следующий сегмент C:
// q = m/n
q += (n*(j +1)-1) < m;