Scrapy - отсутствует тело HTML - PullRequest
0 голосов
/ 10 апреля 2019

При использовании scrapy некоторые веб-сайты не предоставляют полный HTML-код, т.е.https://www.amazon.de/Warner-Bros-5051891109537-GIOCO-MOVIE/dp/B00HR6RHBK

Я пытаюсь получить ссылку на все списки предложений (https://www.amazon.de/gp/offer-listing/B00HR6RHBK/ref=dp_olp_new?ie=UTF8&condition=new)

Scrapy просто не может ее найти.

Пытается:

$ scrapy shell "https://www.amazon.de/Warner-Bros-5051891109537-GIOCO-MOVIE/dp/B00HR6RHBK"

print (response.xpath (" // a [содержит (@href, 'new')] / @ href "))

Результат:

[]

1 Ответ

1 голос
/ 10 апреля 2019

Эта ссылка не существует в источнике страницы. Так что Scrapy не может его найти. Попробуйте найти / gp / offer-list / B00HR6RHBK / ref = dp_olp_all_mbc? Ie = UTF8 & condition = all и посмотреть, сможете ли вы найти эту ссылку

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...