Читая ваши комментарии, похоже, вы захотите использовать параллелизм. Для этого есть инструкции, но они работают только с регистрами, а не с памятью.
Это связано с архитектурой компьютера (я полагаю, x86).
Вы можете одновременно получать доступ только к одной ячейке памяти, поскольку на компьютере имеется только одна адресная шина. Если вы пытаетесь получить доступ более чем к одному местоположению одновременно, вы перегружаете шину, и ничего не будет работать должным образом.
Если вы можете поместить нужные данные в регистры, то вы можете использовать множество классных инструкций процессора, таких как MMX или SSE, для выполнения параллельных вычислений. Но что касается параллельного копирования памяти, это невозможно.
Как уже говорили другие, используйте memcpy. Это надежно, отлажено и быстро.