Как преобразовать отсканированный PDF-файл в редактируемый PDF-файл с помощью Python? - PullRequest
0 голосов
/ 03 ноября 2019

Мне просто нужно знать, можем ли мы преобразовать отсканированный файл PDF в редактируемый файл PDF, используя python. Я знаю пару библиотек вроде pytesseract, pyocr. Руководство в этом отношении будет высоко оценено. Спасибо

1 Ответ

0 голосов
/ 03 ноября 2019
import os
import subprocess

for top, dirs, files in os.walk('/my/pdf/folder'):
    for filename in files:
        if filename.endswith('.pdf'):
            abspath = os.path.join(top, filename)
            subprocess.call('lowriter --invisible --convert-to doc "{}"'
                            .format(abspath), shell=True)

Ссылка от n здесь

Вы должны посмотреть, прежде чем спросить.

...