Я использую stormcrawler для помещения данных в некоторые индексы Elasticsearch, и у меня есть несколько URL-адресов в индексе состояния с различными состояниями - DISCOVERED, FETCHED, ERROR и т. Д.
Мне было интересно, могу ли я сказать StormCrawler просто сканировать URL-адреса с https и со статусом: DISCOVERED и действительно ли это сработает. Я установил es-conf.yaml следующим образом:
es.status.filterQuery: "-(url:https* AND status:DISCOVERED)"
Это правильно? как SC использует es.status.filterQuery? Запускает ли он поиск и применяет ли это значение в качестве фильтра для извлечения только соответствующих документов для извлечения?