Очередь запросов на стороне сервера предоставляется контейнером приложения, а не самим сервлетом.
В случае Tomcat компонент, отвечающий за это, называется Connector, который можно настроить (server.xml) с точки зрения количества потоков, обслуживающих входящие запросы, время ожидания того запроса может остаться необработанным в очереди, размер очередь и т. д.
Посмотрите документацию Tomcat Connector , я считаю, что наиболее важными будут 'acceptCount', 'maxThreads', 'connectionTimeout', 'maxKeepAliveRequests' (если вам требуется http keepAlive).