Я минимально работаю с R.
Мне дали предыдущий скрипт анализа текста сотрудников, который был построен с использованием pdftools :: pdf_text для импорта данных.
I 'Я хотел бы удалить повторяющуюся информацию нижнего колонтитула, которая только запутывает вещи.Нижние колонтитулы содержат документ №, офис, который подготовил отчет, и номер страницы.Я не слишком обеспокоен номером страницы.Документ # и office являются статическими для каждого документа, поэтому это может показаться хорошей целью для grep или какого-либо другого подхода с регулярными выражениями ...
Заранее благодарен за любой совет.