Исходя из вашего комментария к BarsMonsters anser, вам не нужно приближаться к процессору, вам нужна большая целочисленная библиотека.
Одной из опций является gmp, которая включает произвольную целочисленную арифметику. У него есть хорошие алгоритмы для умножения больших целых чисел, и хороший компилятор сделает эту работу лучше, чем большинство людей.
Основная проблема, которая может заставить вас искать альтернативу, заключается в том, что она поддерживает арифметику с переменной точностью, что может оказаться чрезмерной нагрузкой, которую вам лучше избегать, если вы точно знаете, что ваши числа имеют не более 512 двоичных цифр. Тем не менее, вы, вероятно, захотите взглянуть на алгоритмы больше, чем на низкоуровневые уловки (длинное умножение уже может быть плохим выбором при таком размере), и я вполне уверен, что вам будет лучше позволить компилятору выполнить вашу оптимизацию.
Мой совет - тратьте свое время на то, что требует человеческого интеллекта, а не на то, что машина может делать гораздо более последовательно и в миллиард раз быстрее.
И если вы действительно можете оптимизировать машинный код лучше, чем компилятор, загрузите LLVM и внедрите эту логику как этап оптимизации, чтобы мы все могли получить выгоду; -)