Я столкнулся с проблемой производительности многоядерной (8+) архитектуры с программным обеспечением, написанным на C ++ / VistualStudio / WindowsXP.
Внезапно я понял, что понятия не имею о производительности моего кеша L1 и L2 и пропускной способности CPU-> to-> Memory.
Я протестировал несколько инструментов (включая VTune, Glowcode и т. Д.), Но все они не работают при тестировании под нагрузкой в многоядерной архитектуре (именно поэтому они мне и нужны!).
Можете ли вы предложить какой-либо другой инструмент, который не очень интересен для создания графиков, но может дать мне хотя бы несколько указаний на производительность моего кэша / памяти или может предложить фрагменты кода для ручного инструментирования моего приложения?
Спасибо!