Как конвертировать PDF в DOCX на Linux - PullRequest
0 голосов
/ 17 октября 2018

Я пытаюсь конвертировать PDF-файл в Word, Excel и PowerPoint.Я уже пробовал много таких команд:

soffice -env:UserInstallation=file:///$HOME/.libreoffice-headless/ --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
/usr/bin/soffice --headless --invisible --convert-to docx file.pdf
soffice --infilter="writer_pdf_import" --convert-to doc file.pdf

/usr/bin/libreoffice --headless --invisible --convert-to doc file.pdf
/usr/bin/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf

abiword --to=doc file.pdf
unoconv -f doc file.pdf
lowriter --invisible --convert-to doc 'file.pdf'

Всегда получал это сообщение об ошибке от soffice / libreoffice / unoconv:

:1: parser error : Document is empty
%PDF-1.7

И это для abiword

Unable to init server: Could not connect: Connection refused

** (abiword:6477): WARNING **: clutter failed 0, get a life.
Unable to init server: Could not connect: Connection refused

С каждой командой, кроме abiword.У меня есть документ с плохим характером внутри.Но никогда не получайте правильный файл.

Я пытаюсь создать конвертер файлов, поэтому мне нужен только метод командной строки.Не хочу использовать чей-то API.

Спасибо

1 Ответ

0 голосов
/ 17 октября 2018

Удалось сделать это с помощью soffice.Мне пришлось установить этот пакет: libreoffice-pdfimport И не забудьте использовать --infilter = "writer_pdf_import"

...