Я знаю, что для Intel оптимизированы векторные регистры, например, микроархитектура SandyBridge (SSE + AVX), но как насчет графического процессора NVIDIA?
Некоторые источники, которые я где-то читал (я забыл где), утверждали, что используют векторрегистры бесполезны для графических процессоров NVIDIA. Однако у меня был тест-запуск программы с векторными регистрами на графическом процессоре, и по сравнению с одним без них они дали мне apx.Ускорение в 1,7 раза.
К вашему сведению, ЦП Intel дает ускорение в 1,25 раза только для той же программы.
Так что, если NVIDIA оптимизирует эти векторные регистры, может кто-нибудь дать мне объяснение или источник для чтения?Мне это нужно для документации.Спасибо.