Я пишу скребок для извлечения всех ссылок с моего локального веб-сайта.
Я использую этот селектор для извлечения всех значений href всех тегов привязки:
response.xpath('//a/@href')
я получаю следующий результат:
[<Selector xpath='//a/@href' data=u'index.php'>,
<Selector xpath='//a/@href' data=u'membership_passwordReset.php'>,
<Selector xpath='//a/@href' data=u'https://bigprof.com/appgini/'>]
Проблема в том, что на странице есть еще один тег привязки с href = 'admin/pageHome.php'
, который не приходит в результатах.
Любая помощь будет весьмаоценили.
Я прилагаю скриншот исходного кода страницы для справки.