Я однажды видел на сайте диаграмму вызовов, копающуюся в библиотеках самого низкого уровня веб-запроса, инициированного приложением PHP, с синхронизацией вызовов и сводкой. Мне кажется, что это отличный способ выявить причину узких мест, которые не очевидны при профилировании кода только для PHP.
Нечто подобное делает strace, но с гораздо большей детализацией.