Загрузите PDF-файл, встроенный в веб-страницу, используя python2.7 - PullRequest
0 голосов
/ 20 марта 2019

Я хочу скачать PDF и сохранить его в папке на моем локальном компьютере. Следующая ссылка pdf, которую я хочу скачать https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738

Я написал код на обоих языках python selenium и с использованием urllib, но оба не удалось загрузить.

import time, urllib
time.sleep(2)
pdfPath = "https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738"
pdfName = "jco.2018.77.8738.pdf"
f = open(pdfName, 'wb')
f.write(urllib.urlopen(pdfPath).read())
f.close()

Ответы [ 2 ]

1 голос
/ 20 марта 2019
from pathlib import Path
import requests
filename = Path("jco.2018.77.8738.pdf")
url = "https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738"
response = requests.get(url)
filename.write_bytes(response.content)
1 голос
/ 20 марта 2019

С запросами намного проще

import requests 

url = 'https://ascopubs.org/doi/pdfdirect/10.1200/JCO.2018.77.8738'
pdfName = "./jco.2018.77.8738.pdf"
r = requests.get(url)

with open(pdfName, 'wb') as f:
    f.write(r.content)
...