Android Jsoup пропускает теги скрипта - PullRequest
0 голосов
/ 24 сентября 2018

Я пытаюсь написать приложение для своей школы, которое может проанализировать веб-сайт ("http://vertretungsplan.de"). Есть несколько подстраниц для плана замещения, и мне нужно получить для них атрибут href.

Ссылки: Fachgymnasium -> затем Montag, Dienstag, Mittwoch, Donnerstag, Freitag.

Вот мой код

Document doc = Jsoup.connect("https://vertretungsplan.de").maxBodySize(0).header("Accept-Encoding", "gzip, deflate").userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0").timeout(600000).get();
Whitelist wl = new Whitelist().relaxed().removeTags("script");
String cleanText = Jsoup.clean(doc.html() , wl);
Document cleanedhtml = Jsoup.parse(cleanText);
Elements ftext = cleanedhtml.select("a");
for (Element daylink : ftext) {
  builder.append("\n \n").append("Link : ").append(daylink);
}
...