Список основных инструкций MIPS здесь . Большинство упомянутых вами «базовых операций» представляют собой одну или две инструкции MIPS, что, вероятно, относится к большинству современных семейств процессоров.
Однако это вовсе не учитывает архитектуру и характеристики производительности любого из современных процессоров. Различные инструкции часто имеют разные времена завершения. Современные процессоры обычно реализуют предсказание переходов, конвейеры команд, кэширование памяти, распараллеливание и целый ряд других методов, чтобы ускорить выполнение кода.
Следовательно, просто наличие реализации алгоритма на ассемблере ничего не говорит о скорости его выполнения. Вы должны были бы измерить и профилировать код на реальном оборудовании, чтобы получить сопоставимые результаты. Фактически, некоторые алгоритмы могут быть гораздо более эффективными на определенных процессорах, даже в пределах одного семейства процессоров.
Распространенным и довольно понятным примером является эффект кеша инструкций. Развертывание цикла устраняет ряд операций ветвления, что интуитивно ускоряет работу кода. Однако если вы выполняете этот код на процессоре того же семейства с очень небольшим объемом кэш-памяти команд, добавленный доступ к основной памяти может сделать его намного медленнее, чем простой цикл на основе ветвлений.