JSOUP Веб-соскоб с портала поддержки - PullRequest
0 голосов
/ 27 июня 2018

Я новичок в использовании jSoup, и теперь я пытаюсь сделать из этого портала ненужную информацию.

https://supportforums.cisco.com/t5/lan-switching-and-routing/bd-p/6016-discussions-lan-switching-routing

На этом портале я хочу получить из этого списка информацию, которая покажет решенные проблемы, я имею в виду темы, которые имеют особый образ решения, подобного этому.

Решенная задача должна выглядеть так

Я создал соединение с этой страницей таким образом и проверил заголовок этой страницы, чтобы убедиться, что я нахожусь в правильном месте.

        document = Jsoup.connect("https://supportforums.cisco.com/t5/lan-switching-and-routing/bd-p/6016-discussions-lan-switching-routing").get();
        String title = document.title();
        print("Title: " + title);

После этого я начал изучать HTML и понял, что эти темы должны быть элементом списка внутри класса div messageList.MessageList.lia-component-forums-widget-message-list.lia-forum-message-list.lia-component-message-list , но я не уверен в этом. Затем я понял, что каждая тема содержит уникальный идентификатор, и я застрял на нем.

Не могли бы вы помочь мне, как получить все эти элементы, темы? И как отфильтровать решенные темы среди всех? Сначала я просто хочу вывести заголовки этих тем с помощью консоли в Java.

И извините, если я задал глупый вопрос.

1 Ответ

0 голосов
/ 27 июня 2018

Решаемые темы представлены строкой с классом lia-list-row-thread-solved. Основной список потоков находится в элементе с идентификатором grid.

        Document doc = Jsoup.connect(
                "https://supportforums.cisco.com/t5/lan-switching-and-routing/bd-p/6016-discussions-lan-switching-routing")
                .get();
        for (Element e : doc.select("#grid tr.lia-list-row-thread-solved")) {
            String text = e.text();
            System.out.println(text);
        }
...