Я пытаюсь извлечь только набор URL-адресов со страницы, но мой вывод содержит некоторые нежелательные URL-адреса, которые я хотел бы игнорировать.
Вот выражение, используемое для извлечения всех URL:
//div[contains(@id,'internal_trc_')]/div/a[2]/@href
Я пробовал это без удачи:
//div[contains(@id,'internal_trc_')]/div/a[2]/@href[not(contains(text(), 'domain.com'))]