Если тег формы существует на странице после входа в систему - PullRequest
0 голосов
/ 27 марта 2020

Cook ie данные извлекаются для сканирования информации, которую можно просмотреть только после входа с веб-сайта, который вы хотите сканировать.

Но если на странице, которую я хочу увидеть, существует тег формы, есть ли что-нибудь еще, что я должен сделать?

Я попытался соединиться как показано в коде ниже, но вход не был успешным.

Через отладку я подтвердил, что значение идентификатора сеанса существует в поваре ie данные, которые я просканировал.

В чем проблема?

    public void crawlingRewardPenaltyScore() {
        try {
            Document doc = Jsoup.connect(connUrl2).userAgent(userAgent).header("Accept",
                    "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9")
                    .cookies(loginCookie).get();
            Element content = doc.selectFirst("div.content2");
            List<Element> trTags = content.select("tr");

        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }

Описание переменных

connUrl2: Ссылка на сайт, которую я хочу подключить после входа в систему. (http://www.hstree.org/c03/c03_05_02.php) Я гарантирую, что этот сайт не является вредоносным.

userAgent: UserAgent требуется для доступа к этому сайту.

loginCook ie: Cook ie, включая Идентификатор сеанса.

содержание: что я хочу получить. Если мой код работает успешно, это не ноль.

...