Добрый день,
У меня есть ядро openCL, которое использует формулу Лейбница для вычисления числа пи.В настоящее время моя проблема заключается в том, что возвращаемое мной значение не пи, а просто 4.
__kernel void calculatePi(int numIterations, __global float *outputPi,
__local float* local_result, int numWorkers)
{
__private const uint gid = get_global_id(0);
__private const uint lid = get_local_id(0);
__private const uint offset = numIterations*gid*2;
__private float sum = 0.0f;
// Have the first worker initialize local_result
if (gid == 0)
{
for (int i = 0; i < numWorkers; i++)
{
local_result[i] = 0.0f;
}
}
// Have all workers wait until this is completed
barrier(CLK_GLOBAL_MEM_FENCE);
// Have each worker calculate their portion of pi
// This is a private value
for (int i=0; i<numIterations; i++)
{
if (i % 2 == 0)
{
sum += 1 / (1 + 2*i + offset);
}
else
{
sum -= 1 / (1 + 2*i + offset);
}
}
// Have each worker move their value to the appropriate
// local_result slot so that the first worker can see it
// when reducing next
local_result[gid] = sum;
// Make sure all workers complete this task before continuing
barrier(CLK_LOCAL_MEM_FENCE);
// Have the first worker add up all of the other worker's values
// to get the final value
if (lid == 0)
{
outputPi[0] = 0;
for (int i = 0; i < numWorkers; i++)
{
outputPi[0] += local_result[i];
}
outputPi[0] *= 4;
}
}
Я направил все свои входные данные на свой вывод, чтобы убедиться, что они соответствуют моим ожиданиям.numIterations - 16, а numWorkers - 16.
Когда рассчитывается сумма для первого работника, я ожидаю, что сумма будет 1 - 1/3 + 1/5 - 1/7 + 1/9 -1/11 + 1/13 - 1/15 + 1/17 - 1/19 + 1/21 - 1/23 + 1/25 - 1/27 + 1/29 - 1/31
ИспользованиеЭтот калькулятор для первых 16 раз, я ожидаю, что результат будет около 3,2: https://scratch.mit.edu/projects/19546118/
Если я изменю свой последний бит кода, чтобы я мог посмотреть на расчетное значение работника "сумма":
// Have the first worker add up all of the other worker's values
// to get the final value
if (lid == 0)
{
outputPi[0] = sum * 4;
}
Тогда значение, возвращаемое для первого работника, равно 4 вместо ожидаемого 3,2
При изменении любого другого числа, кроме крышки == 0, все остальные работники сообщают свою суммукак 0. Итак, мой вопрос, почему это вычисленное значение?Я делаю что-то не так с моей переменной суммы?Это должна быть закрытая переменная, и цикл for должен быть последовательным, насколько я понимаю, для каждого работника, но многочисленные циклы выполняются параллельно в зависимости от количества работников.
Вот ссылка на мой github, который имеет ядро иОсновной код загружен.
https://github.com/TreverWagenhals/TreverWagenhals/tree/master/School/Heterogeneous%20Computing/Lab2
Спасибо