Извлечение верхнего и нижнего колонтитула из PDF в Python - PullRequest
0 голосов
/ 30 января 2019

Я прочитал PDF, используя pdfminer.Я хочу определить верхний и нижний колонтитулы PDF.Пожалуйста, дайте мне знать, если есть возможность.

1 Ответ

0 голосов
/ 30 января 2019

Также возможно с Apache Tika:

import tika
from tika import parser

FileName = "PDF File Name"
PDF_Parse = parser.from_file(FileName)
print(PDF_Parse ['content'])
print(PDF_Parse ['metadata']) # Format-Dictionary
...