Question

Я копирую pdf файлы с сайта, используя Scrapy, фреймворк для просмотра веб-страниц Python.

Сайт должен пройти тот же сеанс, чтобы вы могли скачать PDF.

Он отлично работает с Scrapy's, потому что он полностью автоматизирован, но когда я запускаю скрипт через пару секунд, он начинает выдавать мне поддельные pdf-файлы, например, когда я пытаюсь получить прямой доступ к pdf, без моей сессии.

Почему это так и есть идеи, как преодолеть эту проблему!?

warvariuc · Answer 1 · 13 ноября 2011

Я думаю, что сайт отслеживает вашу сессию. Если это сайт PHP, передайте файл cookie PHPSESSID в запрос на загрузку файла PDF.

Загрузка файлов PDF с помощью Scrapy

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Загрузка файлов PDF с помощью Scrapy

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов