Когда я пытаюсь сделать CTRL + U на веб-сайте, это больше, чем то, что я получаю от jsoup. Сайт, который я использую, - Open SAP -> https://open.sap.com/courses Пробовали тайм-аут и maxbodysize вместе с jsoup.connect. Сейчас мой код выглядит так:
private static String getHtml(String location) throws IOException {
URL url = new URL(location);
URLConnection conn = url.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String input;
StringBuilder builder = new StringBuilder();
while((input = in.readLine()) != null)
{
builder.append(input);
}
return builder.toString();
}
document = Jsoup.parse(getHtml(URL));
Но все равно возвращается тот же HTML. По селену это возможно, но это немного медленнее, поэтому какой-либо другой способ добиться этого? Потому что цель - найти ссылки на курсы, а затем загрузить их, чтобы найти их краткое изложение курса, которое с использованием селена будет слишком медленным.
Пожалуйста, предложите, что можно здесь сделать.