У меня есть рекурсивная функция, которая вызывает себя дважды.Моя попытка распараллелить функцию в конечном итоге работает, но в то же время выполняет много избыточных вычислений, уничтожая все выгоды от параллелизма.
Основная программа пытается вычислить вспомогательный граф, который является промежуточной структурой данныхтребуется для вычисления всех связанных с k-ребром компонентов графа.
Я уже несколько месяцев пытаюсь решить эту проблему, и я решил обратиться за помощью только в качестве последнего средства.Я буду признателен за любые комментарии или предложения, указывающие мне в правильном направлении;Я не обязательно ищу решение на тарелке.
Я пытался использовать #pragma omp single nowait, но это привело только к последовательному выполнению кода.
Я пытался использовать cilk_spawnв другой раз, но это только привело к тому, что моему компьютеру не хватило памяти.Я предполагаю, что было запущено слишком много процессов.
Я извлек суть проблемы в минимальный рабочий пример, который я вставил ниже.
Приведенный ниже код повторяет каждое вычисление примерно восемь раз.Я предполагаю, что восемь различных процессов запускают отдельную копию программы вместо одновременной работы над частями проблемы.
#include <iostream>
#include <omp.h>
#include <numeric>
#include <vector>
#include <random>
#include <algorithm>
using namespace std;
int foo(std::vector<int> V, int s){
int n = V.size();
if (n>1){
std::cout<<n<<" ";
std::random_device rd; // obtain a random number from hardware
std::mt19937 eng(rd()); // seed the generator
std::uniform_int_distribution<int> distr(0, n-1); // define the range
int t = 1;
auto first = V.begin();
auto mid = V.begin() + (t);
auto mid_1 = V.begin() + (t);
std::vector<int> S(first, mid);
std::vector<int> T(mid_1, V.end());
#pragma omp parallel
{
#pragma omp task
foo(S, s);
#pragma omp task
foo(T, t);
}
}
return 0;
}
int main(){
std::vector<int> N(100);
iota(N.begin(), N.end(), 0);
int p = foo(N,0);
return (0);
}
Моя цель - заставить все процессы / потоки работать вместе для завершения рекурсии.