Question

Если у нас есть функция __host__ __device__ в CUDA, мы можем использовать макросы для выбора различных путей кода для кода на стороне хоста и на стороне устройства в его реализациях, например:

__host__ __device__ int foo(int x)
{
#ifdef CUDA_ARCH
    return x * 2;
#else
    return x;
#endif
}

, но почемуРазве мы не можем написать:

__host__ __device__ int foo(int x);

__device__ int foo(int x) { return x * 2; }
__host__   int foo(int x) { return x; }

вместо этого?

Michael Kenzel · Answer 1 · 14 октября 2018

Реализация CUDA в CUDA C ++ фактически поддерживает перегрузку на __host__ и __device__, потому что она считает квалификаторы пространства выполнения частью сигнатуры функции.Обратите внимание, однако, что даже там вы должны будете объявить две функции отдельно:

__device__ int foo(int x);
__host__ int foo(int x);

__device__ int foo(int x) { return x * 2; }
__host__   int foo(int x) { return x; }

проверить это здесь

Лично я неконечно, насколько желательно / важно, чтобы это было действительно.Учтите, что вы можете просто определить foo(int x) в коде хоста вне вашего источника CUDA.Если кто-то сказал мне, что им нужно иметь разные реализации одной и той же функции для хоста и устройства, где по какой-либо причине необходимо определить версию хоста как часть источника CUDA, мое первоначальное инстинктивное ощущение было бы, что, вероятно, что-то происходит немногостранного направления.Если версия хоста делает что-то другое, не должно ли оно иметь другое имя?Если он логически делает то же самое, просто не используя графический процессор, то почему он должен быть частью источника CUDA?Я бы вообще выступал за то, чтобы сохранить как можно более четкое и строгое разделение между кодом хоста и устройства и сохранить любой код хоста внутри исходного кода CUDA до минимума.Даже если вы не заботитесь о чистоте своего кода, это по крайней мере сведет к минимуму шансы получить травму от всей магии компилятора, которая происходит под капотом ...

Почему мы не можем разделить реализации host и device?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему мы не можем разделить реализации __host__ и __device__?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы

Почему мы не можем разделить реализации host и device?