Как преобразовать документ, созданный в Jsoup (анализатор HTML html) в строку - PullRequest
23 голосов
/ 29 июля 2011

У меня есть документ, созданный в jsoup, который выглядит следующим образом

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

Как мне преобразовать это doc в строку.

Ответы [ 3 ]

36 голосов
/ 29 июля 2011

Вы пробовали:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

Как Документ расширяется Элемент также есть метод html () , который "получает«внутренний HTML-код элемента» в соответствии с API .Это должно сработать:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

Дополнительная информация:

Каждый Документ объект имеет ссылку на экземпляр внутреннего класса Document.OutputSettings , доступ к которому можно получить с помощью метода outputSettings () Document.Там вы можете включить / отключить симпатичную печать, используя установщик prettyPrint (true / false) .См. API для Document и Document.OutputSettings для получения дополнительной информации

8 голосов
/ 29 июля 2011

doc.toString() работает, как и doc.outerHtml().

0 голосов
/ 03 сентября 2014
 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

После разбора строки на документ вы можете использовать на ней функции документа

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);
...