Jsoup неправильно анализирует ответ сервера - PullRequest
0 голосов
/ 05 мая 2020

Я не понимаю, почему Jsoup не может разобрать ответ. Код парсера:

public static void main(String[] args) {
        Document document = null;
        try {
            document = Jsoup
                    .connect(URL)
                    .userAgent(USER_AGENT)
                    .header("x-fsign", "SW9D1eZo")
                    .get();
        } catch (IOException e) {
            e.printStackTrace();
        }

//        Objects.requireNonNull(document).outputSettings().charset(StandardCharsets.ISO_8859_1);
        System.out.println(document);

Respose:

body>
  SA÷1¬~ZA÷ИТАЛИЯ: Серия А¬ZEE÷COuk57Ci¬ZB÷98¬ZY÷Италия¬ZC÷Gfk7JcX4¬ZD÷t¬ZE÷fmgMpgPf¬ZF÷0¬ZO÷0¬ZG÷1¬ZH÷98_COuk57Ci¬ZJ÷2¬ZL÷/football.................

Когда я устанавливаю другую кодировку (ISO_8859_1), как написано везде (строка раскомментирования):

Objects.requireNonNull(document).outputSettings().charset(StandardCharsets.ISO_8859_1);

Response с сервера:

<html>
 <head></head>
 <body>
  SA÷1¬~ZA÷&#x418;&#x422;&#x410;&#x41b;&#x418;&#x42f;: &#x421;&#x435;&#x440;&#x438;&#x44f;..............

Что делать дальше?

...