Это на самом деле не ответ, а своего рода расширенный комментарий к ответам других людей.
Встроенная сборка все еще используется для доступа к функциям ЦП. Например, в чипах ARM, используемых в сотовых телефонах, разные производители выделяют свои предложения с помощью специальных функций, которые требуют необычных инструкций машинного языка, которые не имеют эквивалента в C / C ++.
В 80-х и начале 90-х я много использовал встроенную сборку для оптимизации циклов. Например, компиляторы C, нацеленные на процессоры 680x0, тогда делали бы действительно глупые вещи, такие как:
calculate a value and put it in data register D1
PUSH D1, A7 # Put the value from D1 onto the stack in RAM
POP D1, A7 # Pop it back off again
do something else with the value in D1
Но мне не нужно было делать это, наверное, через пятнадцать лет, потому что современные компиляторы намного умнее. Фактически, современные компиляторы иногда генерируют более эффективный код, чем большинство людей. Особенно с учетом процессоров с длинными конвейерами, прогнозированием ветвлений и т. Д., Последовательность команд, выполняемая быстрее всего, не всегда является наиболее подходящей для человека. Таким образом, вы можете сказать: «Делайте A B C D в таком порядке», и компилятор будет разбирать порядок вокруг для большей эффективности.
Немного поиграть со встроенной сборкой - это хорошо для начинающих, но если вы серьезно, я присоединяюсь к тем, кто предлагает вам перейти к «настоящему» ассемблеру через некоторое время.