Техника может быть похожей, но помните, что с CUDA у вас одновременно работают сотни потоков. Если в MATLAB используются потоки, а эти потоки работают на ядре Quad, вы получите только 4 потока, исполняемых за такт, в то время как вы можете получить пару сотен потоков для работы на CUDA с таким же тактом.
Итак, чтобы ответить на ваш вопрос, ДА, эффективность в этом примере не зависит от методики и относится только к аппаратному обеспечению.