размер основного пула - задает, сколько потоков может работать параллельно, что означает, что 5 пользователей могут иметь доступ одновременно. Если происходит больше обращений, он сохраняется в очереди, которая настраивается с помощью параметра максимальный размер пула
Итак, согласно вашей конфигурации после 5 пользователей следующие пять пользовательских запросов будут находиться в очереди. После того, как очередь заполнится, все запросы будут отклонены.
Скажем, если один запрос завершается из первых пяти, то запускается один запрос из пяти в очереди и т. Д.
См. Это для Чтение пула потоков относительно пружинной загрузки https://www.baeldung.com/thread-pool-java-and-guava