Наличие некоторой структуры, похожей на очередь, для хранения ожидающих запросов - довольно распространенная модель. В веб-приложениях, где может быть несколько уровней обработки, вы видите подход в стиле «воронка», когда ранние части изменения обработки имеют большие очереди. Также может быть установлен какой-то тип приоритетов для очередей, запросы с более высоким приоритетом перетасовываются в верхнюю часть очереди.
Одна важная вещь, которую следует учитывать в вашем решении, состоит в том, что если частота поступления запросов выше, чем ваша скорость обработки (это может быть связано с атакой типа «отказ в обслуживании» или просто то, что какая-то часть обработки сегодня необычайно медленная), то ваш очереди будут увеличиваться без ограничений. Вы должны иметь некоторую политику, например, немедленно отклонять новые запросы, когда глубина очереди превышает какое-либо значение.