Как извлечь абзац с веб-сайта с помощью JSoup? - PullRequest
0 голосов
/ 18 декабря 2011

Мне нужно получить тело статьи с этого URL:

Aggie Headline

Я знаю, что статья находится внутри тегов div class = "article-body". Как я могу извлечь его как строку?

Ответы [ 2 ]

0 голосов
/ 18 марта 2012
Document doc = Jsoup.connect("http://www.ncataggies.com/ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205346437").get();
Element element = doc.select("div.article-body").first();
String text = element.text();
System.out.println(text);
0 голосов
/ 20 декабря 2011

попробуйте этот код

Document doc = Jsoup.connect("http://www.ncataggies.com//ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205346437").get();
            Elements element = doc.getElementsByClass("article-body");
            String text = element.text();
             System.out.println(text);
...