Вы правы, когда думаете с точки зрения стресс-теста. Вы должны иметь возможность воспроизвести ожидаемое количество пользователей, чтобы точно знать, сколько одновременно пользователей сможет обрабатывать ваше приложение.
Вы начинаете с небольшого числа пользователей, а затем можете увеличивать его, пока не достигнете точки, когда ваше приложение перестает отвечать за приемлемое количество времени.
Боюсь, на этот вопрос нет простого ответа, но самый простой способ сделать это, о котором я могу подумать, - написать простой скрипт, который будет выполнять запросы GET / POST (возможно, даже с помощью wget) и запускать его на ферма на Amazon EC2 или что-то в этом роде, чтобы вы могли по-настоящему достичь максимальной емкости своей инфраструктуры.