Сделана небольшая функция, которая преобразует его:
from pdfminer3.pdfparser import PDFParser
from pdfminer3.pdfdocument import PDFDocument
def convertPdfDatetime(pd):
from datetime import datetime
dtformat = "%Y%m%d%H%M%S"
clean = pd.decode("utf-8").replace("D:","").split('+')[0]
return datetime.strptime(clean,dtformat)
fp = open('/home/prtjohanson/test.pdf', 'rb')
parser = PDFParser(fp)
doc = PDFDocument(parser)
pdf_creation_date = doc.info[0]["CreationDate"]
print(pdf_creation_date)
print(convertPdfDatetime(pdf_creation_date))
По какой-то причине на моем Linux-компьютере у меня нет суффикса, начинающегося с + в конце строки datetime, я подозреваю, что это как-то связано с часовым поясом, или это может зависеть от того, как сам файл pdf был создано.
В любом случае приведенный выше код должен охватывать оба случая.