Я использую ядро умножения матриц pyopencl в том ядре, в котором они инициализировали переменную, подобную этой
__ local float Asub [TS] [TS];