CUDA GEMM реализация с выборкой текстуры - PullRequest
0 голосов
/ 28 апреля 2020

Я хочу использовать выборку текстуры в реализации GEMM; теперь A и B создаются с помощью cudaMallo c, поэтому можно привязать только 1D текстуру к этому массиву, а также использовать cudaAddressModeBorder в качестве режима текстуры, теперь возникла проблема, для реализации на основе гемовых плиток, нужно получить плитку прямо сейчас выборка плитки должна быть в изображениях: matrix A tile fetch

, потому что некоторые элементы не связаны, но память массива линейна, когда используется выборка текстуры для данных вне привязки точно начать выборку данных следующего столбца; не то же самое, что 2D-текстура, которая будет ограничена до 0. Как решить эту проблему, поэтому, когда я использую 1d-текстуру, также будет возвращать 0 для не связанных данных?

...