Я хочу реализовать следующую формулу: Si = (x1 - w1) + ... + (xn - wn) как Conv = x1 * w1 + ... xn * wn для некоторой области под X (входной тензор) и ядро W. Важно, чтобы эта операция повторялась на всех участках X со срезом W с параметрами шага и отступа, как простая свертка.
Как это сделать?
Некоторое время назад я нашел похожий вопрос по stackoverflow. Но он закончился на пользовательской реализации на C ++ и компиляции или изменении исходного кода CUDA или чего-то в этом роде.
Есть ли сегодня более легкий путь?