Размер статически распределенной разделяемой памяти на блок с помощью Compute Prof (Cuda / OpenCL) - PullRequest
1 голос
/ 14 октября 2010

В Nvidia compute prof есть столбец «Статическая личная память на рабочую группу», и во всплывающей подсказке указано «Размер статически распределенной разделяемой памяти на блок». Мое приложение показывает, что я получаю 64 (байт я предполагаю) за блок. Означает ли это, что я использую где-то между 1-64 из этих байтов или профилировщик просто говорит мне, что этот объем разделяемой памяти был выделен и кто знает, использовался ли он вообще?

1 Ответ

1 голос
/ 14 октября 2010

Если это выделено, это, вероятно, потому что вы использовали его.AFAIK CUDA передает параметры ядрам через разделяемую память, поэтому это должно быть так.

...