Это зависит от того, работает ли ваше приложение с данными, которые используются совместно, если оно запускается в параллельных процессах, потому что это, скорее всего, определит, где ожидается узкое место в скорости.
Например, если приложение обращается к базе данных или дисковым файлам, вам, вероятно, придется смоделировать несколько потоков / процессов, запрашивающих приложение, чтобы увидеть, как они уживаются друг с другом, то есть должны ли они ждать друг друга при доступе к общему ресурсу.
Но если приложение выполняет только некоторые внутренние вычисления, все самостоятельно, то оно может хорошо масштабироваться, если все его данные помещаются в память (т. Е. Не требуется доступ к виртуальной памяти, например, доступ к диску). Затем вы можете протестировать производительность только одного экземпляра и сосредоточиться на оптимизации его скорости.
Это также может помочь указать операционную систему, которую вы планируете использовать. Mac OS X предлагает инструменты для тестирования и оптимизации производительности, которых нет в Windows и Linux, и наоборот.