Структура DOM в Scrapy отличается от структуры в браузере - PullRequest
0 голосов
/ 05 мая 2020

Я пытаюсь научиться парсить веб-контент с помощью Scrapy и столкнулся с проблемой, которую не могу понять. Я не могу понять, почему это происходит; Я могу выбрать элемент DOM с помощью любых инструментов разработчика браузера, но когда я пытаюсь выбрать тот же элемент из Scrapy , возвращается пустой список. Здесь вы можете видеть, что этот xpath //*[@class='lSPager lSGallery']/li/a/img[@src] отлично работает в браузере enter image description here, но ничего не возвращает, когда он вызывается из Scrapy : empty string returned from scrapy
Более того Scrapy полностью не видит lSPager класс
enter image description here
, который можно легко выбрать в браузере enter image description here enter image description here

1 Ответ

1 голос
/ 05 мая 2020

Хорошо, я понял это сразу после того, как написал вопрос. Проблема заключалась в том, что у меня в браузере было включено JavaScript. Я отключил JS, и структура DOM в браузере стала такой же, как в Scrapy.

...