Если у вас нет встроенного эмулятора или коммутационного блока вокруг вашего ЦП, нет такой вещи, как синхронизация по одной петле или одной инструкции. Вам нужно объединить свои тестовые прогоны до чего-то, что занимает по крайней мере несколько секунд каждый, чтобы уменьшить количество ошибок, вызванных другими процессами, происходящими в ЦП, ОС и т. Д.
Если вы хотите точно узнать, сколько времени занимает выполнение определенного цикла, а выполнение занимает, скажем, менее 1 секунды, вам нужно искусственно увеличить количество итераций, чтобы чтобы получить число, которое выше "минимального уровня шума". Затем вы можете взять это число и разделить его на число искусственно завышенных итераций, чтобы получить показатель, который показывает, сколько времени займет один проход через целевой цикл.
Если вы хотите сравнить производительность различных стилей или техник цикла, то же самое справедливо: вам потребуется увеличить количество итераций или проходов по тестовому коду, чтобы получить измерение, в котором то, что вас интересует, доминирует во временном интервале, который вы измеряете.
Это верно, независимо от того, измеряете ли вы производительность с помощью высокопроизводительных счетчиков с точностью до миллисекунды, предоставляемых ЦП, системными часами или настенными часами, чтобы измерить прошедшее время вашего теста.
В противном случае вы просто измеряете белый шум.