Честно говоря, я не вижу проблемы.Из вашего описания кажется, что машина, на которой должен выполняться финальный код, поддерживает SSE4.1 и DPPS
.Следовательно, после компиляции исходного кода, включая встроенный (или сборочный), его можно выполнить на этом компьютере.Вам нужно будет только скомпилировать свой код с более новой версией компилятора, либо установив более новую версию на машину, о которой вы говорите, либо скомпилировав ее на другом компьютере, а затем скопировав исполняемый файл на компьютер, который потребуетсязапустить на.
Стоит ли оптимизация с DPPS
усилиями, которые будут зависеть от вашего кода (т. е. насколько велик потенциал для оптимизации - вы должны тщательно проанализировать, чтобы выяснить, где ваши узкие места)есть) и насколько важна производительность в данном конкретном случае (т. е. стоит ли ваше время ?; время - деньги)
Очевидно, что если у вас мало опыта сборки, реализация вашей рутины вasm, или, может быть, даже просто написание собственной функции-оболочки asm около DPPS
, становится менее привлекательным.(Но это, безусловно, можно сделать.)