используя команду Scrapy fetch для автоматической записи видимого html в файл? - PullRequest
0 голосов
/ 01 марта 2020

Я нахожусь в моих первых днях изучения scrapy. В тот момент, когда я начинаю работать с новой страницей, я go на приглашение cmd и ввожу, например,

scrapy fetch https://www.bbc.co.uk

. Он немедленно покажет полную html этой страницы в поле cmd. , Затем я вручную подсвечиваю, копирую и вставляю html в блокнот, чтобы проверить информацию, которую я хочу почистить, поскольку я обнаружил, что некоторые сайты не могут быть полностью просмотрены с помощью скрапа.

Там должно быть более простой способ, чем копирование и вставка в блокнот вручную. Есть ли модификатор команды, который я мог бы добавить к команде fetch, чтобы он сохранил html в файл?

Ответы [ 2 ]

0 голосов
/ 02 марта 2020

Получилось достаточно быстрое исправление, вот оно;

scrapy shell url

, тогда

view(response)

покажет, что scrap видит, отображая это в вашем браузере. При необходимости можете просмотреть html оттуда.

0 голосов
/ 01 марта 2020

scrapy fetch --nolog https://www.bbc.co.uk > response.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...