Как исключить Javascript из необработанного HTML в scrapy - PullRequest
0 голосов
/ 08 октября 2018

Я делаю скребок, который очищает сайт с тегами HTML, но проблема в том, что у сайта, который я очищаю, есть реклама между контентом, поэтому селекторы XPath также очищают сценарии, чего я не хочу.

response.xpath('//*[@class="entry-inner"]/p').extract()

Итак, как исключить JavaScript из HTML?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...