Cook ie данные извлекаются для сканирования информации, которую можно просмотреть только после входа с веб-сайта, который вы хотите сканировать.
Но если на странице, которую я хочу увидеть, существует тег формы, есть ли что-нибудь еще, что я должен сделать?
Я попытался соединиться как показано в коде ниже, но вход не был успешным.
Через отладку я подтвердил, что значение идентификатора сеанса существует в поваре ie данные, которые я просканировал.
В чем проблема?
public void crawlingRewardPenaltyScore() {
try {
Document doc = Jsoup.connect(connUrl2).userAgent(userAgent).header("Accept",
"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9")
.cookies(loginCookie).get();
Element content = doc.selectFirst("div.content2");
List<Element> trTags = content.select("tr");
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
Описание переменных
connUrl2: Ссылка на сайт, которую я хочу подключить после входа в систему. (http://www.hstree.org/c03/c03_05_02.php) Я гарантирую, что этот сайт не является вредоносным.
userAgent: UserAgent требуется для доступа к этому сайту.
loginCook ie: Cook ie, включая Идентификатор сеанса.
содержание: что я хочу получить. Если мой код работает успешно, это не ноль.