Как мне получить этот текст с помощью Jsoup? - PullRequest
5 голосов
/ 23 февраля 2012

Как мне получить "этот текст" из следующего HTML-кода, используя Jsoup?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
        height=10 src="img.jpg" /><span class="blah">
        <span>Other texts</span><span class="sometime">00:00</span></span>
        </a></h2>

Когда я пытаюсь

String s = document.select("h2.title").select("a[href]").first().text();

, возвращается

этот текстДругие тексты00: 00

Я пытался прочитать API для Селектор в Jsoup, но не смог понять, сколько.элемент класса class="link title blah" (несколько классов?).Простите, я немного знаю как Jsoup, так и CSS.

1 Ответ

9 голосов
/ 23 февраля 2012

Используйте Element#ownText() вместо Element#text().

String s = document.select("h2.link.title a[href]").first().ownText();

Обратите внимание, что вы можете выбирать элементы с несколькими классами, просто объединяя селекторы имен классов, например h2.link.title, который выберет <h2> элементов, которые имеют по крайней мере оба link и title класс.

...