Совет Джейсона верен. Наилучшие ускорения, которые вы получите, будут получены при «обнаружении» того, что вы позволили алгоритму O (n 2 ) попасть во внутренний цикл или что вы можете кэшировать определенные вычисления вне дорогих функций.
По сравнению с микрооптимизациями, которые может вызывать PGO, это большие победители. После того, как вы сделали этот уровень оптимизации, вам может помочь PGO. Нам никогда не везло с этим - стоимость инструментов была такой, что наше приложение стало необычайно медленным (на несколько порядков).
Мне нравится использовать Intel VTune в качестве профилировщика прежде всего потому, что он неинвазивен по сравнению с инструментальными профилировщиками, которые слишком сильно меняют поведение.