Question

Это нечто раздутое, поэтому я заранее прошу прощения.Мне интересно, как gprof работает на низком техническом уровне.Я понимаю, что это делается таймерами, но тогда почему исполняемый файл должен быть специально скомпилирован для профилирования?Компиляция заставляет пространство быть выделенным для статистики?

Кроме того, как точно выполняется синхронизация?

Mike Dunlavey · Answer 1 · 18 февраля 2011

Просто прочитайте статью (снова), позвольте мне попытаться объяснить это.

Предположим, он берет сэмплы с частотой 100 Гц, за исключением случаев, когда процесс заблокирован по IO или по какой-либо другой причине. Каждый образец записывает ПК, который находится в какой-то функции. Количество выборок в этой функции увеличивается.

Таким образом, если в конце цикла было (скажем) 1000 выборок, это означает, что общее время выполнения (только для процессора) составляло 10 секунд. Если подпрограмма B записала, скажем, 500 из этих выборок, это означает, что ее общее время выполнения составляет 1/2 от общего количества, или 5 секунд. Это его время , потому что в нем есть компьютер. Это не говорит о том, сколько времени в среднем нужно выполнить. Чтобы сказать это, вам нужно знать, сколько раз он был вызван. Также не включает время, проведенное в вызываемых пользователях.

Когда код компилируется с флагом -pg , специальный код вставляется в код ввода каждой подпрограммы. Это замечает, что подпрограмма B введена, и это замечает, что она вызывается с сайта вызова в подпрограмме A. Есть таблица, проиндексированная этим сайтом вызова, где этот вызов может быть посчитан. Таким образом, в конце gprof может сказать, сколько раз B было вызвано в общей сложности, и сколько из них было из A.

Чтобы получить среднее собственное время B, его полное собственное время делится на количество раз, которое оно вызывается.

Чтобы получить общее совокупное время (self + callees) процедуры A, gprof необходимо время self A, плюс общее количество вызовов каждой подчиненной процедуры B, умноженное на среднее совокупное время B. затем число делится на общее количество вызовов A, чтобы получить среднее совокупное время A.

Звучит хорошо, пока рекурсия не входит в картину, где она становится еще более запутанной.

Это все очень умно, и, как указывают авторы, полно предостережений.

Dr G · Answer 2 · 13 февраля 2011

Ну, это дает хорошее объяснение . Также это объясняет статистическое профилирование

По сути, gprof изменит исполняемый файл вашей программы (это называется инструментирование кода ) для хранения некоторой бухгалтерской информации, например, сколько раз вызывается функция.

Бит статистического профилирования приходит от регулярного отслеживания счетчика программ, чтобы получить пример того, что делает ваш код.

Gprof делает оба. Он обрабатывает код и собирает образцы, просматривая счетчик программ.

Как именно работает gprof?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как именно работает gprof?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы