Почему значения не анализируются из файла span на веб-сайте? - PullRequest
0 голосов
/ 14 июля 2020

Я пытаюсь получить информацию из IMDB, в частности названия, даты и рейтинги фильмов. Jsoup может анализировать заголовки и даты, но не рейтинги.

Элемент записывается так:

<span class="ipl-rating-star_rating">7.3</span>

, и это написано в моем коде как таковое:

Elements rating = doc.select("span.ipl-rating-star_rating");

И даты, и рейтинги взяты из класса span, поэтому в моей программе их код выглядит похожим, но работают только даты:

for(Element f: year) {//add to array list "date"
            date.add(f.getElementsByTag("span").first().text());
}


for(Element g: rating) {//add to array list "ratings"
            ratings.add(g.getElementsByTag("span").first().text());
}

Когда я печатаю date.size ( ), Я получаю 82, но rating.size () отображает 0.

Вот URL-адрес веб-сайта:

Document doc = Jsoup.connect("https://www.imdb.com/list/ls005750764/").get();

1 Ответ

0 голосов
/ 16 июля 2020

Стоит проверить документацию: https://jsoup.org/cookbook/extracting-data/selector-syntax, так как есть несколько хороших примеров ...

Думаю, вы хотите:

doc.select("span[class=ipl-rating-star_rating]");
...