Сегодня я опробовал утилиту linux ' perf , и мне сложно интерпретировать ее результаты. Я привык к callgrind от Valgrind, который, конечно, является совершенно другим подходом к методу перфектов на основе выборки.
Что я сделал:
perf record -g -p $(pidof someapp)
perf report -g -n
Теперь я вижу что-то вроде этого:
+ 16.92% kdevelop libsqlite3.so.0.8.6 [.] 0x3fe57 ↑
+ 10.61% kdevelop libQtGui.so.4.7.3 [.] 0x81e344 ▮
+ 7.09% kdevelop libc-2.14.so [.] 0x85804 ▒
+ 4.96% kdevelop libQtGui.so.4.7.3 [.] 0x265b69 ▒
+ 3.50% kdevelop libQtCore.so.4.7.3 [.] 0x18608d ▒
+ 2.68% kdevelop libc-2.14.so [.] memcpy ▒
+ 1.15% kdevelop [kernel.kallsyms] [k] copy_user_generic_string ▒
+ 0.90% kdevelop libQtGui.so.4.7.3 [.] QTransform::translate(double, double) ▒
+ 0.88% kdevelop libc-2.14.so [.] __libc_malloc ▒
+ 0.85% kdevelop libc-2.14.so [.] memcpy
...
Хорошо, эти функции могут быть медленными, но как мне узнать, откуда они вызываются? Поскольку все эти горячие точки лежат во внешних библиотеках, я не вижу способа оптимизировать мой код.
По сути, я ищу какой-то коллограф, аннотированный с накопленной стоимостью, где мои функции имеют более высокую стоимость выборки, чем те библиотечные функции, которые я вызываю.
Возможно ли это с перфом? Если так - как?
Примечание: я обнаружил, что "E" разворачивает callgraph и дает несколько больше информации. Но вызов-граф часто не достаточно глубок и / или завершается случайным образом, не давая информации о том, сколько информации было потрачено где. Пример:
- 10.26% kate libkatepartinterfaces.so.4.6.0 [.] Kate::TextLoader::readLine(int&...
Kate::TextLoader::readLine(int&, int&)
Kate::TextBuffer::load(QString const&, bool&, bool&)
KateBuffer::openFile(QString const&)
KateDocument::openFile()
0x7fe37a81121c
Может ли быть проблема, что я работаю на 64-битной? См. Также: http://lists.fedoraproject.org/pipermail/devel/2010-November/144952.html (я не использую fedora, но, похоже, он применим ко всем 64-битным системам).