Jsoup выберите div _ngcontent - PullRequest
0 голосов
/ 28 июня 2018

Я пытаюсь использовать Jsoup для извлечения некоторой информации с веб-сайта, но я не знаю, как получить доступ к содержимому даты в нижней части кода . Я использовал команду выбора с "div", но она не работает. Как я могу это сделать? Спасибо!

1 Ответ

0 голосов
/ 29 июня 2018

Из изображения, которое вы имеете в своем запросе, кажется, что вы пытаетесь получить дату в пределах 'br', br - это разрыв строки. Даже с помощью CSS нам нечего извлечь из этого. Следовательно, можно попробовать обходной путь, подобный тому, чтобы взять текст под тегом «маленький», разделить его и взять вторую часть. При таком подходе вам необходимо более тщательно проверять DOM и проверять наличие сбоев. Для ограниченного HTML, доступного в изображении, вы можете использовать следующее:

    String[] text = doc.select("div > small").text().split("\"");
    System.out.println(text[1]);
...