Я устанавливаю скрипт на основе PDFparser .Это работает для большинства типов PDF для меня.Мне удалось вывести текст в том же формате, в котором он отображается в PDF
$text .= nl2br($page->getText());
Теперь мне нужно выяснить, как удалить верхние и нижние колонтитулы.Из того, что я понял в моем ограниченном исследовании, они не особо отмечены в PDF.Я предполагаю, что если у меня один и тот же тип документа, я смогу найти какой-то шаблон и добавить регулярное выражение.
Вот ссылка на тестовый файл, с которым я работал: https://docdro.id/NyFyxJq
Как это обычно делается?Кто-нибудь мог сделать это с PdfParser?