Я новичок в программировании cuda и заинтересован в реализации алгоритма, который при последовательном кодировании вычисляет два или более средних из вектора за один проход.Какова будет эффективная схема для выполнения чего-то подобного в cuda?
Есть два вектора длины N, значения элементов и значения индикатора, определяющие, к какому подмножеству относится каждый элемент.
Есть лиэффективный способ сделать это за один проход, или это должно быть сделано за M проходов, где M - количество вычисляемых средств и использование вектора индексных ключей для значений элементов каждого подмножества?