Конечно, вы все равно получите время настенных часов, но, вероятно, вы пытаетесь получить время процессора.
Это нетривиально, если задействованы подпроцессы (или не связанные процессы). Однако вы можете попытаться использовать более целостный подход к сравнительному анализу.
Измерение задержки приложения достаточно просто (просто посмотрите на настенные часы), но пропускная способность, как правило, сложнее.
Чтобы получить представление о том, как приложение ведет себя под нагрузкой, необходимо воспроизвести его под нагрузкой (на оборудовании промышленного уровня) воспроизводимым способом.
Обычно это означает одновременное выполнение множества задач, так как современное оборудование может выполнять несколько задач одновременно. Более того, если что-то в вашем приложении когда-либо ожидает какого-либо внешнего источника данных (включая, возможно, жесткий диск вашей собственной машины), вы можете получить лучшую пропускную способность даже на одном ядре, обслуживая несколько запросов одновременно.
Возможно, вы захотите взглянуть на такие инструменты, как oprofile, который предназначен для профилирования, а не для бенчмаркинга.