При выполнении pdf.getDocumentInfo()
для документа, созданного в Документах Google, возвращается {'/Producer': u'Skia/PDF m83'}
. Я проверил это на нескольких документах Google, и, кажется, проверить. Это имеет смысл - Skia - это проект Google , поэтому он должен использоваться для создания документов на их сервере.
Так что вы можете просто сделать:
import PyPDF2
GOOGLE_DOCS_PDF_METADATA = {'/Producer': u'Skia/PDF m83'}
def file_is_google_doc(pdf_file_path)
pdf = PyPDF2.PdfFileReader(pdf_file_path)
return pdf.getDocumentInfo() == GOOGLE_DOCS_PDF_METADATA