Как я могу выяснить, какие элементы использовать в качестве параметров для cssQuery - PullRequest
0 голосов
/ 20 июня 2019

Мне бы очень хотелось понять, как на самом деле извлечь нужные мне данные с веб-сайта.Я сделал это с помощью верхней диаграммы IMDb, которую я получил из учебника на YouTube, но меня просто смущает, как узнать, какой синтаксис нужно вставить для параметров row.select.

Я пытался сделать это с другими сайтамитакие как Best Buy, получение цены и названия конкретных ноутбуков, и я потерпел неудачу, потому что я почти уверен, что поставил неправильные параметры (cssQuery).

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import javax.swing.*;
import java.io.IOException;


public class Scraper {
static  String title;
static final String url  = "https://www.imdb.com/chart/top";
public static void main(String args[])throws IOException {

    final Document document = Jsoup.connect(url).get();

    for(Element row: document.select("table.chart.full-width tr")){
            final String title = row.select(".titleColumn a").text();
            final String rating = row.select(".imdbRating").text();
            System.out.println(title);
            System.out.println(rating);
   }
}

}

1 Ответ

0 голосов
/ 20 июня 2019

из-за того, что я понял из нашего вопроса, вы не знаете, какой класс css поместите в ваш код. для этого вы можете проверить веб-сайт, щелкнув правой кнопкой мыши по веб-сайту и щелкнув по элементу inspect, и оттуда вы можете проверить класс div, нажав Ctrl + Shift + C и наведя курсор мыши на любой элемент веб-сайта, как показано на рисунке ниже.

...