Попытка извлечь данные из PDF-файла, но похоже, что форма зашифрована - PullRequest
0 голосов
/ 06 июля 2019

В настоящее время я пытаюсь извлечь введенные данные в формате PDF.В PDFbox я могу получить объект AeroForm и увидеть, что он имеет только один элемент.Проблема в том, что этот PDF-файл содержит 48 страниц, и почти на каждой странице есть форма.Теперь я знаю, как я могу проанализировать каждый элемент формы и получить каждый из них (как я делал в других PDF-файлах), но дело в том, что этот PDF-файл имеет только одну форму с одним полем.Он называется Gendate, и, похоже, в нем есть куча зашифрованных файлов.

Я просмотрел его в PDFxplorer и обнаружил, что это как 404 КБ зашифрованных данных, которые мне нужно извлечь.Теперь я могу сгладить это и сделать на нем орк, но это подвержено ошибкам, и мы должны быть точными с данными.Я опубликую ссылку на текстовый файл, который содержит зашифрованный вывод.

Я могу нормально просматривать PDF-файл из Adobe Reader без необходимости вводить пароль.Я думаю, что это пароль владельца, который его шифрует.Есть ли способ извлечь эту информацию?Или, может быть, хэш файла?Или что-то, что позволило бы мне хотя бы прочитать данные в форме?

Я знаю, что пароль пользователя пуст, но в форме все еще есть некоторые вещи, которые не сохраняются в «обычном тексте»для легкого извлечения.Я использовал pdfCrack, но я не уверен, как использовать выведенные данные.Я получаю это:

Security Handler: Standard
V: 1
R: 2
P: 65476
Length: 40
Encrypted Metadata: True
FileID: 916bb1966dd59f2129ade3e439126531
U: 7158e5e11dd9c385534464b63f551b9d55ace51d2daa6522cedca826e9db2883
O: 2055c756c72e1ad702608e8196acad447ad32d17cff583235f6dd15fed7dab67

РЕДАКТИРОВАТЬ: Вот PDF-файл: https://drive.google.com/file/d/14wbOuSPwH308j0M5-dHesB9YA69ntL01/view?usp=sharing

Вот текстовый файл: https://drive.google.com/file/d/1EuDcAReXstth0EsmOK9zPdL7pLtKFuGZ/view?usp=sharing

ПРИМЕЧАНИЕ: Да, я понимаючто я мог бы попытаться использовать грубую силу, но я собираюсь иметь много других PDF-файлов и честно просто делать грубое принуждение не будет эффективным.

...