Ладно, это дикая догадка, но ... если вы настроили VS2005, например, this для работы на ассемблере, то вы можете получить руководство SSE4.1 от Intel и код макроса для каждого необходимого кода операции SSE4.1 в соответствии с этим потоком на masm32.com (где обсуждается аналогичная проблема с SSE2.)
Например, вот код из одной из загрузок по ссылке masm32:
;SSE2 macros for MASM 6.14 by daydreamer aka Magnus Svensson
ADDPD MACRO M1,M2
db 066h
ADDPS M1,M2
ENDM
ADDSD MACRO M1,M2
DB 0F2H
ADDPS M1,M2
ENDM