Есть ли возможность настроить сгенерированный Clang код для определенного числа потоков на ядро процессора?
Например, процессоры IBM POWER поддерживают до восьми независимых потоков выполнения на ядро процессора.А IBM XL C / C ++ Compiler имеет настраиваемый подопцию , который предназначен для лучшего планирования сгенерированных машинных инструкций.Например, -mtune=power9:smt4
предназначен для настройки кода для работы в режиме SMT4 (четыре потока на ядро).