Аннотирование PDF-файлов в виде диаграммы - PullRequest
1 голос
/ 10 февраля 2020

Я хотел бы сделать содержательные аннотации к PDF. В моем конкретном случае этот PDF-файл будет содержать данные о заработной плате, но данные, как правило, не являются дискретными. Если бы это было так, аннотации на самом деле не имели бы значения.

Что я хочу отметить, это фрагменты данных в качестве ссылки на алгоритмы, написанные для анализа этих данных. Например, метаданные сотрудника - имя, номер SSN, номера счетов, часы, ставки оплаты и т. Д. c .-- будут последовательно распределяться в пределах одного документа (в основном), но по-разному в зависимости от источника документа, а иногда по-разному в источнике документа (например, компания Payroll X может немного перемещать поля данных для разных клиентов или по мере того, как они продолжают выполнять итерацию при форматировании). Аннотирование позволит заранее планировать модель синтаксического анализа, а также будет служить справочной информацией. Я хотел бы отметить интересующие данные, какое бы имя я ни дал в модели анализа, это относительное положение на странице и т. Д. c. Я думаю, что пронумерованные метки сетки на концах линий сетки и некоторые неокрашенные выноски. Эти документы могут быть сложными. См. Макет ниже.

mockup of annotation grid

Попытка разметки напечатанного документа быстро приводит к путанице и не позволяет выполнять рефакторинг. Я предпринял несколько разных успешных попыток, используя Adobe Acrobat Pro, у которого есть возможность аннотации anemi c -at-best (я рад ошибаться). Использование Inkscape работало намного лучше, но все еще было неопрятно. Я ожидаю, что Illustrator или любое другое универсальное векторное приложение будет похожим. У меня нет доступа к Visio, но я использовал его онлайн-конкурентов, таких как Lucidchart и Draw.io , и функционально они в порядке, но я не могу использовать их с документами, содержащими PII. Я посмотрел на PDF Annotator и Okular, и их механизмы аннотаций более приспособлены для выделения цифрового текста, чем для построения диаграмм.

Есть ли какое-то приложение, которое я пропускаю, чтобы упростить это достичь? Вполне возможно, что приложение с векторной иллюстрацией подойдет лучше всего, но, возможно, было бы лучше преобразовать PDF в другой формат документа, более подходящий для такого рода диаграмм.

Ссылки: Я прочитал следующие вопросы SO, которые по-разному связаны между собой, но, кажется, на самом деле не отвечают моим потребностям: - Систематически аннотируйте PDF - Аннотирование PDF-файлов Adobe Reader математическими символами

...