Лучший инструмент для преобразования PDF в форматы файлов на основе XML и сохранения макета и стилей - PullRequest
0 голосов
/ 23 февраля 2012

Я пытался использовать Adobe Acrobat X Pro, и его функции экспорта в HTML по-прежнему не хватает. Некоторые тексты, которые явно выделены жирным шрифтом, не сохраняются. НО я запустил документ с помощью инструмента, похожего на OCR, и он смог сохранить стили в экспортированном текстовом документе. Затем я взял это слово document и экспортировал в HTML.

Каковы лучшие инструменты для простого преобразования PDF в HTML и сохранения их в той же степени, что и стили и макеты?

Я слышал, что Poppler довольно хорош, но мне не удалось скомпилировать его на моем Mac.

1 Ответ

0 голосов
/ 24 февраля 2012

pdftohtml от poppler - но не забудьте получить последнюю версию.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...