Чтобы сделать что-то подобное, вам нужно создать собственный подкласс scrapy's FilesPipeline
.
Чтобы загрузка произошла, вам понадобится пользовательский get_media_requests
метод, который должен получить URL-адреса от вашего элемента и вернуть итерируемые запросы, которые будут использоваться для загрузки файлов.
После этого вам также необходимо изменить item_completed
и / или file_downloaded
метод для сохранения результата в точном соответствии с вашими требованиями.
Если вам нужно больше подробностей, чем то, что предусмотрено в документах, взгляните на источник и посмотрите, как работает существующий конвейер.работы.