Если вы сканируете один сайт, вам не нужно 2 рабочих или более одного осколка ES и носика!в любом случае все URL-адреса будут направлены на один сегмент!
Вы используете 5 потоков в очереди, но извлекаете только 2 URL-адреса на группу из ES ( es.status.max.urls.per.bucket:2 ) и форсирование 2 с между вызовами в ES ( spout.min.delay.queries: 2000 ), поэтому в среднем носик не может выдавать более 1 URL в секунду.Кроме того, refresh_interval в ES_IndexInit.sh влияет на то, как быстро изменения видны в индексе и, следовательно, насколько вероятно, что вы получите свежие URL-адреса из запроса.
Просто измените es.status.max.urls.per.bucket до большего значения, например 10, и сбросьте spout.min.delay.queries до того же значения, что и refresh_interval в ES_IndexInit.sh например, 1 сек.Это даст вам гораздо больше URL.