Является ли использование SSE2 встроенным в параллель_ для хорошей идеи? Это зависит.Это определенно не плохая идея.Вы должны профилировать свой код и использовать встроенные функции там, где производительность важнее всего.
Поскольку количество регистров SSE2 ограничено, повлечет ли это штраф с точки зрения производительности? Если вас это беспокоитс давлением регистра вы не должны беспокоиться об этом.При использовании встроенных функций компилятор выполняет распределение регистров (в отличие от написания сборки).Код, который написан от руки, обычно более компактен, чем код, скомпилированный из языка высокого уровня.Вы должны профилировать свой код после каждого внесенного изменения, чтобы увидеть, улучшается ли производительность.
Есть ли у каждого кристалла ЦП свои регистры SSE2? Каждый логический ЦП имеет свои 8 (в 32-битный режим) или 16 (в 64-битном режиме) регистров XMM.В современных процессорах каждое ядро является логическим процессором или даже двумя логическими процессорами, если у вас включена гиперпоточность.