Я только нашел замечание, что локальная память медленнее, чем память регистров, типа два на поток.
Предполагается, что общая память работает быстро, но быстрее ли она, чем локальная память [потока]?
То, что я хочу сделать, это своего рода медианный фильтр, но с заданным процентилем вместо медианы. Таким образом, мне нужно взять кусочки из списка, отсортировать их, а затем выбрать подходящий. Но я не могу начать сортировку списка общей памяти, или что-то идет не так. Потеряю ли я производительность при копировании в локальную память?