Я пытаюсь реализовать встроенный ассемблер (в коде C / C ++), чтобы использовать преимущества SSE. Я хотел бы скопировать и продублировать значения (из регистра XMM или из памяти) в другой регистр XMM. Например, предположим, у меня есть некоторые значения {1, 2, 3, 4} в памяти. Я хотел бы скопировать эти значения так, чтобы xmm1 заполнялся {1, 1, 1, 1}, xmm2 - {2, 2, 2, 2} и т. Д. И т.
Просматривая справочные руководства Intel, я не смог найти инструкцию для этого. Мне просто нужно использовать комбинацию повторяющихся MOVSS и вращений (через PSHUFD?)?