Metal Compute против ARM Neon - PullRequest
       7

Metal Compute против ARM Neon

0 голосов
/ 20 ноября 2018

Я думал о переносе моего текущего кода Neon (набора команд векторной обработки для ARM) в Metal, но после запуска примера кода HelloCompute (который демонстрирует, как выполнять параллельные вычисления данных с использованием графического процессора), графический процессор кажется намного медленнеечем использование процессора.

Проекту HelloCompute на iPhone 5S требуется 13 мс, чтобы выполнить это базовое ядро ​​с текстурой RGBA 512 x 512.

{
    half4 inColor = inTexture.read(gid);
    outTexture.write(inColor, gid);
}

Для сравнения, мой код Neon занимает менее 1 мс !!!

GPU не должен быть хотя бы быстрее, чем CPU?

1 Ответ

0 голосов
/ 20 ноября 2018

GPGPU имеет смысл только при работе с огромным количеством вычислений, потому что время инициализации передачи данных / HW портит удовольствие в дополнение к ужасным API, таким как OpenCL.

NEON, с другой стороны, тесноИнтегрирован в основной конвейер и, таким образом, намного быстрее реагирует, упаковывая больше, чем адекватный удар.

AI и крипто-майнинг были в значительной степени единственными областями, которые я видел до сих пор, где GPGPU имеет смысл.Для всего более легкого SIMD - это путь.

А поскольку крипто-майнинг монет практически мертв, а IP-адреса, предназначенные для вычислений, связанных с ИИ, не за горами, я бы сказал, что GPGPU почти бессмыслен.

...