Я пытаюсь исключить список ссылок, которые я не хочу сканировать.
Я не смог найти ничего полезного в документации, которая пропускает запрошенные пользователем URL.
Однако я смог сделать это так:
if(!(link.attr("href").startsWith("https://blog.olark.com") ||
link.attr("href").startsWith("http://www.olark.com")||
link.attr("href").startsWith("https://www.olark.com")||
link.attr("href").startsWith("https://olark.com") ||
link.attr("href").startsWith("http://olark.com"))) {
this.links.add(link.absUrl("href")); //get the absolute url and add it to links list. }
Конечно, это неправильный способ сделать это, поэтому я обернул ссылки в список и попытался перебрать его - однако он не исключил ни одной ссылки (код ниже):
List<String> exclude = Arrays.asList("https://blog.olark.com", "http://www.olark.com", "https://www.olark.com", "https://olark.com", "http://olark.com");
for (String string : exclude) {
if(!link.attr("href").startsWith(string)) {
this.links.add(link.absUrl("href")); //get the absolute url and add it to links list.
}
}
Итак, мой вопрос: как мне избежать списков URL? Я думаю о чем-то похожем на второй блок кода, который я написал, но я открыт для идей или исправлений.