Разбор данных с помощью Jsoup - PullRequest
       8

Разбор данных с помощью Jsoup

0 голосов
/ 03 февраля 2020

У меня есть строка, содержащая эти данные:

<div>
  <a href='https://www.some.html'>
    <img src='https://besttv232.jpg' alt='null' title='null' border='0' width='100' height='56'>
  </a>
</div>
Some text is also over here

Мне нужно разобрать ее с помощью Jsoup, мне нужен URL-адрес href, URL-адрес img и данные (немного текста ...)

Я пробовал с:

Document doc = Jsoup.parse(myData); //myData is string with content above
Elements links = content.get("div");

for (Element link : links) {
    String linkHref = link.attr("href");
    String linkHrefa = link.attr("img");
    String linkText = link.text();
}

Ответы [ 2 ]

1 голос
/ 03 февраля 2020

Мне нужен HREF URL

Element a = doc.select("a").first();
String src = a.attr("href");

IMG URL

Element img = doc.select("img").first();
String src = img.attr("src");

данные

String content = doc.body().text();
0 голосов
/ 03 февраля 2020

Что такое переменная "content" в вашем коде? А зачем тебе l oop? Вы можете использовать css селекторы для достижения вашей цели - href -> doc.select("div > a").attr("href") img url -> dec.select("div > img").attr("src"), если в документе есть только текст, используйте document.text() для данных (Некоторый текст ...)

...