Я хочу сохранить объявление компании о Listco из PDF-URL
Однако выходной файл моего кода на Python оказывается пустым.
Я попытался извлечь текст из PDF напрямую, однако это упрощенный китайский, и даже utf-16 не может полностью его расшифровать.
Пожалуйста, помогите
import requests
from PyPDF2 import PdfFileReader, PdfFileWriter
url_pdf='http://static.sse.com.cn/disclosure/listedinfo/announcement/c/2018-11-15/601318_20181115_1.pdf'
r = requests.get(url_pdf)
fo = open('file_name.pdf','wb')
fo.write(r.content)
fo.close()
with open('file_name.pdf','rb') as file:
pdf=PdfFileReader(file)
info = pdf.getDocumentInfo()
pages=pdf.numPages
print(pdf.getPage(1).extractText())