Загрузка файла PDF по ссылке https, которая использует Google Analytics для загрузки - PullRequest
0 голосов
/ 13 сентября 2018

Я пытаюсь скачать PDF-файл по ссылке https.Я попробовал этот код

import requests 
file_url = "https://www.hindawi.org/books/64790927.pdf"

r = requests.get(file_url, stream = True) 

with open("pythonH.pdf","wb") as pdf: 
    for chunk in r.iter_content(chunk_size=1024): 

         # writing one chunk at a time to pdf file 
         if chunk: 
             pdf.write(chunk) 

Но кажется, что вместо загрузки PDF создается файл размером 42 КБ.Я попытался вставить ссылку в веб-браузере и обнаружил, что она перенаправляет на другую веб-страницу.Кроме того, когда я проверил исходный код http перенаправленной веб-страницы, я обнаружил, что в href ссылки pdf есть опция «onclick».эта опция вызывает функцию "ga", которая, я думаю, используется аналитикой Google.

Мой вопрос: как использовать python для загрузки этой ссылки без перенаправления на другую веб-страницу?или другими словами, как быть с функцией ga для загрузки нужного файла?Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...