Ваш вопрос слишком широкий, и на него очень трудно ответить.Более того, только небольшой процент алгоритмов (те, которые работают без большого общего состояния) выполним с графическими процессорами.
Но я хочу призвать вас критически относиться к претензиям.Я занимаюсь обработкой изображений и читаю много статей на эту тему, но довольно часто в случае с графическим процессором время загрузки входных данных в графический процессор и загрузки результатов обратно в основную память составляет , а не .при расчете коэффициента.
Хотя есть несколько случаев, когда это не имеет значения (оба являются маленькими или существует вычисление второго этапа, которое еще больше уменьшает результат в размере), обычно приходитсяперенесите результаты и исходные данные.
Я видел, как это превращало заявленный плюс в отрицательный, потому что время загрузки / выгрузки было больше, чем требовалось основному ЦП для вычисления.
Практически то же самое относится и к объединению результатов разных видеокарт.
Обновление Новые графические процессоры, по-видимому, могут одновременно загружать / скачивать и вычислять, используя буферы для пинг-понга.Но совет, чтобы проверить условия границы тщательно все еще остается в силе.Там много спина.