Мы используем clang для компиляции кода IR, а затем выполняем IR в некоторых местах.
По некоторым причинам мы добавляем «-fno-inline» в опциях компиляции, что приводит к очень плохой производительности.Прежде чем IR-код занимает менее 1 мс, после открытия «-fno-inline» IR-код занимает более 20 мс.
Насколько я понимаю, inline исключает только стоимость вызовов функций (таких как rbp / rsppush / pop, call / ret).
Я прав?Есть предложения?