Я хочу использовать элементарные функции в памяти устройства с нецелыми числами (с плавающей и двойной), например, я видел в CUDA C Руководство по программированию следующий код для реализации функции atomicAdd
для двойной-точные числа с плавающей точкой:
код, извлеченный из Руководство по программированию в CUDA C :
#if __CUDA_ARCH__ < 600
__device__ double atomicAdd(double* address, double val)
{
unsigned long long int* address_as_ull =
(unsigned long long int*)address;
unsigned long long int old = *address_as_ull, assumed;
do {
assumed = old;
old = atomicCAS(address_as_ull, assumed,
__double_as_longlong(val +
__longlong_as_double(assumed)));
// Note: uses integer comparison to avoid hang in case of NaN (since NaN != NaN)
} while (assumed != old);
return __longlong_as_double(old);
}
#endif
Возможно ли сделать что-то подобное в openCL ?,У меня есть устройство с возможностью вычислений 2.1
UPD
Мне удалось написать эквивалент исходного кода, который, кажется, работает:
double atom_add_double(__global double* address, double val) {
__global long* address_as_ull =
(__global long*)address;
long old = *address_as_ull;
long assumed;
do {
assumed = old;
old = atom_cmpxchg(address_as_ull, assumed,
as_long(val + as_double(assumed)));
// Note: uses integer comparison to avoid hang in case of NaN (since NaN != NaN)
} while (assumed != old);
return as_double(old);
}
Подробнее в ответе на пост, спасибо @ pmdj.