Счетчики производительности в современных процессорах x86_64 идеально подходят для определения того, какой код выполняется при таких событиях, как пропадание кэша, неправильное предсказание ветвлений, пропуски TLB команд / данных, предварительные выборки и т. Д.perf
и oprofile
.AMD и Intel предлагают коммерческие инструменты (для Linux и других платформ) для записи и анализа этих одинаковых счетчиков производительности.