Question

У меня есть большой кусок сгенерированных данных (A [i, j, k]) на устройстве, но мне нужен только один «фрагмент» A [i,:,:], а в обычной CUDA может быть легко достигнуто с некоторой арифметикой указателя.

Можно ли сделать то же самое в пикуде? то есть

cuda.memcpy_dtoh(h_iA,d_A+(i*stride))

Очевидно, что это совершенно неверно, поскольку нет информации о размере (если не выводится из формы dest), но, надеюсь, вы поняли идею?

talonmies · Answer 1 · 19 апреля 2011

Класс pyCUDA gpuArray поддерживает нарезку одномерных массивов, но не большие измерения, которые требуют шага (хотя он и наступает). Однако вы можете получить доступ к базовому указателю в многомерном gpuArray от члена gpuarray, который является типом pycuda.driver.DeviceAllocation, и информации о размере от члена gpuArray.dtype.itemsize. Затем вы можете выполнить ту же арифметику указателей, которую вы имели в виду, чтобы получить то, что будут принимать функции memcpy драйвера.

Это не очень питонно, но оно работает (или, по крайней мере, так и было, когда я в прошлом году много занимался взломом pyCUDA + MPI).

fabrizioM · Answer 2 · 19 апреля 2011

Маловероятно, что реализовано в PyCuda.

Я могу подумать о следующих решениях:

Скопировать весь массив A в памяти и сделатьnumpy массив из интересующего среза.
Создайте ядро, которое считывает матрицу и создает желаемый срез.
Переставьте произведенные данные таким образом, чтобы вы могли одновременно прочитать срез из указателяарифметика.

Адресация памяти PyCUDA: Смещение памяти?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Адресация памяти PyCUDA: Смещение памяти?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы