Войти на сайт nytimes используя запросы в python - PullRequest
0 голосов
/ 09 сентября 2018

Я делаю некоторые новости с сайта nytimes. Я начал использовать API nytimes для получения URL-адресов, где хранятся новости, которые я хочу. Некоторые из них не в тексте (мне нужно вернуться до 80-х годов), поэтому я хотел бы скачать PDF-новости.

У меня есть подписка на nytimes, которая позволяет мне загружать PDF, проблема в том, что я не могу войти в систему каждый раз, когда попадаю на веб-страницу, я пытался использовать библиотеку запросов для аутентификации, но я не смог к.

Позвольте мне быть более конкретным:

Я хочу получить следующую историю в формате PDF

https://query.nytimes.com/gst/abstract.html?res=9903E7DC1538E732A25752C0A9679C94619FD6CF

enter image description here

Моя цель - войти в верхнюю правую кнопку, html-код кнопки следующий:

enter image description here

Первая проблема, с которой я сталкиваюсь, заключается в том, что форма входа не в оригинальном html, а появляется после нажатия кнопки и выглядит примерно так:

enter image description here

Я знаю, что я мог бы сделать это с помощью селена, проблема в том, что мне нужно делать это много раз, мне нужно копить кучу новостей и не хочу делать это, используя браузер.

Есть ли способ войти с запросами библиотеки? Может быть, повторив вызов, чтобы получить HTML-форму?

Большое спасибо заранее

...