Сохраняйте разобранные ссылки в строку или в массив java - PullRequest
0 голосов
/ 21 февраля 2012
String html = Jsoup.connect("www.example.com").get().html();
Scanner in = new Scanner(html);

String links ;
while(in.hasNext()){
    String line = in.nextLine();
    if(line.contains("sometext")){

String  links += line.substring(line.indexOf("http").line.indexOf("</a>") + "\n");

    }

У меня есть код выше. Он получает HTML-код веб-страницы с помощью JSoup, и после этого я хочу сохранить их в строку или массив, разделенный новой строкой. Это моя проблема.

1 Ответ

0 голосов
/ 21 февраля 2012

Вы должны продолжать использовать jsoup для извлечения и анализа HTML.Кроме того, документация jsoup адресована этому .

String output = "";
// Get the webpage and parse it.
Document doc = Jsoup.connect(url).get();
// Get the anchors with href attribute.
// Or, you can use doc.select("a") to get all the anchors. 
Elements links = doc.select("a[href]");
// Iterate over all the links and process them.
for (Element link : links) {
  output += link.attr("abs:href");
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...