как разобрать html - PullRequest
       8

как разобрать html

0 голосов
/ 05 августа 2010

Я скачал Java HtmlParser , но я не знаю, как использовать API для извлечения данных HTML. Можете ли вы привести пример, чтобы я мог поработать над этим?

1 Ответ

2 голосов
/ 05 августа 2010

Вы говорите о HtmlParser ? Скорее выберите парсер с менее подробным API, как Jsoup . Все, что вам нужно выучить, это CSS-селекторы , которые уже достаточно очевидны для среднего разработчика веб-интерфейса.

Вот начальный пример, который отображает ваш текущий вопрос и имена всех отвечающих:

package com.stackoverflow.q3416036;

import java.net.URL;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Test {

    public static void main(String[] args) throws Exception {
        URL url = new URL("https://stackoverflow.com/questions/3416036");
        Document document = Jsoup.parse(url, 3000);

        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }

}

Смотри также:

...