Конвертируйте pdf в docx без изменения размера шрифта, полужирного шрифта и т. Д. В python3.x - PullRequest
0 голосов
/ 17 октября 2019

Я хочу конвертировать PDF в docx, используя python3.x в ubuntu16.x. Я прошел через код, указанный ниже:

for top, dirs, files in os.walk(pdfdir):
  for filename in files:
    if filename.endswith('.pdf'):
        i = i + 1
        abspath_pdf = os.path.normpath(os.path.join(top, filename))

        print 'Converting {0} into .doc format..'.format(abspath_pdf)
        subprocess.call('{0} --invisible --convert-to doc{1} --outdir "{2}" "{3}"'
                        .format(lowriter, outfilter, docdir, abspath_pdf), shell=True)

Но это не работает для меня. Может ли кто-нибудь помочь в этом?

Заранее спасибо.

1 Ответ

0 голосов
/ 23 октября 2019

Вы можете использовать Aspose.Words Cloud для конвертирования PDF в форматы MS Word https://products.aspose.cloud/words/python Следует также отметить, что формат PDF является фиксированным форматом страницы, а форматы MS Word - потоковыми форматами. Это делает преобразование из PDF в MS Word довольно сложной задачей. Aspose.Words Cloud распознает элементы в PDF, поэтому вывод редактируется в MS Word. Смотрите следующую ссылку, чтобы узнать больше о преобразовании PDF в Word https://docs.aspose.cloud/display/wordscloud/Convert+PDF+Document+to+Word

...