QPDF дает файл не найдена ошибка в python - PullRequest
0 голосов
/ 13 апреля 2020

enter image description here Я использую qpdf для расшифровки PDF-файлов (зашифрованных, но без пароля), так как расшифровка pypdf2 не работает. Он работает в командной строке, но с python дает FileNotFoundError

qpdf --decrypt --replace-input test.pdf # it's working; replacing test.pdf with the absolute path

Но с python это не

inp_file = open(self.path, "rb")
inp_pdf = PdfFileReader(inp_file)
if inp_pdf.isEncrypted:
    try:
        inp_pdf.decrypt('')
    except:
        subprocess.run(["qpdf", "--decrypt", "--replace-input", self.path)])

1 Ответ

0 голосов
/ 13 апреля 2020

Я перешел на pikepdf . Он построен поверх QPDF; краткое описание в цитатах ниже. Очень просто создавать новые PDF-файлы на основе существующих PDF-файлов. Кроме того, он обрабатывает дешифрование на лету.

Pikepdf предоставляет оболочку Pythoni c для библиотеки преобразования содержимого C ++ PDF, QPDF.

Не реализует извлечение текста из PDF-файлов; Я использовал тика для извлечения текста.

...