XPath пересечение двух множеств - PullRequest
0 голосов
/ 06 ноября 2011

Мне нужно извлечь все ссылки из HTML-документа, содержащего текст в качестве внутреннего элемента, а не ссылку на изображение. В основном я хотел бы сделать doc.select ("// a / attribute :: href") для всех элементов в дереве, где doc.select ("// a / text ()") возвращает что-либо. Спасибо!

1 Ответ

1 голос
/ 06 ноября 2011

Ну, вы можете написать условия в XPath в предикате в квадратных скобках, например //a[text()]/@href выбирает атрибуты href всех элементов ссылки (a), у которых есть хотя бы один дочерний текстовый узел. Или, если вы хотите убедиться, что в ссылке нет дочернего элемента img, вы можете использовать, например, //a[not(img)]/@href.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...