Профилировщик с открытым исходным кодом для анализа низкоуровневой архитектурной неэффективности? - PullRequest
1 голос
/ 06 апреля 2009

Современные процессоры используют всевозможные уловки, чтобы преодолеть разрыв между большой скоростью их элементов обработки и запоздалостью внешней памяти. В приложениях, критичных к производительности, то, как вы структурируете свой код, часто может существенно повлиять на его эффективность. Например, исследователи, использующие анализатор SLO , смогли исправить проблемы с локальностью кэша и удвоить скорость выполнения нескольких тестовых программ SPEC2000. Я ищу рекомендации для инструмента с открытым исходным кодом, который использует поддержку мониторинга производительности процессора для определения и анализа неэффективных архитектурных решений, таких как ошибки в кеше, ошибочные прогнозы ветвлений, интерфейсные остановки, загрязнение кеша из-за псевдонимов адресов, длинных инструкций по задержке и пропусков TLB. , Мне известны Intel VTune (коммерческий), AMD CodeAnalysist (бесплатный, но не с открытым исходным кодом) и Cachegrind (зависит от симуляции).

1 Ответ

1 голос
/ 06 апреля 2009

Для Linux oprofile работает хорошо. На самом деле, CodeAnalysist от AMD использует oprofile в качестве бэкэнда.

Oprofile использует механизм настройки производительности процессора для анализа неэффективности архитектуры.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...