Удалите верхние и нижние колонтитулы из текстового вывода с помощью Smalot \ PdfParser - PullRequest
0 голосов
/ 27 мая 2019

Я устанавливаю скрипт на основе PDFparser .Это работает для большинства типов PDF для меня.Мне удалось вывести текст в том же формате, в котором он отображается в PDF

$text .= nl2br($page->getText());

Теперь мне нужно выяснить, как удалить верхние и нижние колонтитулы.Из того, что я понял в моем ограниченном исследовании, они не особо отмечены в PDF.Я предполагаю, что если у меня один и тот же тип документа, я смогу найти какой-то шаблон и добавить регулярное выражение.

Вот ссылка на тестовый файл, с которым я работал: https://docdro.id/NyFyxJq

Как это обычно делается?Кто-нибудь мог сделать это с PdfParser?

...