Как использовать быстрые URL-фильтры в StormCrawler? - PullRequest
0 голосов
/ 17 сентября 2018

Я наткнулся на фильтры быстрого URL.он дает несколько вариантов, таких как применение фильтров к конкретному домену. Может ли кто-нибудь рассказать подробнее об его использовании и о том, как настроить его в url filters.json?

1 Ответ

0 голосов
/ 17 сентября 2018

Фильтр можно настроить в urlfilters.json , как и любой другой фильтр, т. Е.

 {
  "class": "com.digitalpebble.stormcrawler.filtering.regex.FastURLFilter",
  "name": "FastURLFilter",
  "params": {
    "file": "fast.urlfilter.json"
  }
}

Параметр file является необязательным и по умолчанию принимает значение, указанное выше.

Подробнее см. JAVADOC , БЛОГ и WIKI .

...