Есть ли эффективная функция копирования памяти в вызове __device__? - PullRequest
0 голосов
/ 11 апреля 2020

среда

Я использую версию CUDA 10.1. vs2017 cmake 3.17.0

вызов функции

при использовании вызова функции cudaMemcpyAsync() или cudaMemcpy() in __device__.

ошибка выброса

всегда выдает ошибку, что:

error: calling a __host__ function("cudaMemcpyAsync") from a __device__ function("Init") is not allowed

требуется помощь

Мне нужно скопировать буфер размером 0 - 4 Кбайт внутри устройства . и буфер должен быть Синхронизирован, сгенерированный предыдущим результатом. я хочу скопировать память как можно быстрее, но не должно появляться таких ошибок, как

, таких как

  1. чтение после записи
  2. запись до записи.

Вот некоторые относительные ссылки в { ссылка }

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...