Вы можете попытаться передать 4 байта за раз на 32-битной платформе. Однако , я не удивлюсь, если попытка сделать это вручную в конечном итоге будет медленнее, чем то, что компилятор сгенерировал изначально.
То, что вы делаете, настолько просто, насколько это возможно. Сомнительно, что что-то можно сделать для дальнейшей оптимизации, если только предоставленный вами код не совсем подходит, и вы не записываете константы времени компиляции в эти адреса.