Я хочу загрузить множество файлов pdf по ссылкам в формате pdf, отсканированных пауками-спайсерами, но когда я использую scrapy.Request(pdf_url)
в filepipeline для сканирования pdf-сети, в конечном итоге он загрузил неполные файлы pdf. все PDF-файлы были 1 КБ, кроме первых нескольких файлов (которые завершены). Мне пришлось использовать requests.get(pdf_url, stream=True)
для полной загрузки всех файлов PDF, но это слишком медленно. Я хочу знать, имеет ли подобный метод подобный метод в scipes filesplines?