Использование JSoup для извлечения содержимого таблицы HTML - PullRequest
9 голосов
/ 22 ноября 2011

Как мне извлечь содержимое таблицы, расположенной по адресу: / id / 2 / year / 2012 / acc-conference "> http://espn.go.com/mens-college-basketball/conferences/standings//id/2/year/2012/acc-conference

Несколько примеров, которые я видел, не слишком ясны ополучить содержимое таблицы. Кто-нибудь может предложить какую-либо помощь?

1 Ответ

16 голосов
/ 10 февраля 2012

Возможно, вы уже решили эту проблему, но это будет проходить по каждой таблице и выводить название команды и столбец Win / Loss. Отрегулируйте для нужной вам информации. Вторая таблица, очевидно, отформатирована по-разному, поэтому, если вы хотите получить информацию, отличную от этой таблицы, вам придется выполнить дальнейшую настройку. Дайте мне знать, если вам понадобится дополнительная помощь.

    Document doc = Jsoup.connect("http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference").get();

    for (Element table : doc.select("table.tablehead")) {
        for (Element row : table.select("tr")) {
            Elements tds = row.select("td");
            if (tds.size() > 6) {
                System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
            }
        }
    }
...