JSoup - анализ этого вложенного HTML неупорядоченного списка - PullRequest
1 голос
/ 09 февраля 2020

Я пытаюсь разобрать это вложенное HTML с веб-сайта, но я просто не могу понять, как извлечь данные из неупорядоченного списка.

<ul class="no-bullet participants-list" data-registrations="registrants">
     <li class="participant" data-participant-id="512028" data-registrations="registrant">
         <div class="row collapse participant-info">
             <div class="large-1 small-2 columns"> 
                 <figure class="participant-avatar">
                    <a class="user-profile-link" href="THE LINK I WANT">

Что я ' я пробовал

for(Element row : doc.select("ul.no-bullet participants-list")) {
         row.select("li.participant")
             .select("div.row collapse participant-info")
             .select("div.large-1 small-2 columns")
             .select("figure.participant-avatar")
             .select("a.href").text());
}

Не уверен, что я делаю не так

1 Ответ

2 голосов
/ 09 февраля 2020

Насколько я понимаю, вы ищете атрибут href внутри тега a . Ваше утверждение select неверно, поскольку вы используете пробел вместо точки, чтобы выбрать класс

Вместо этого

doc.select("ul.no-bullet participants-list")

Используйте это

doc.select("ul.no-bullet.participants-list a").first().attr("href")

Как видите, я выбрал первый тег a и получил href из этого тега

...