Конвертировать файл PDF в один файл HTML - PullRequest
2 голосов
/ 30 января 2012

Я пытаюсь преобразовать документ PDF в один файл HTML в Java.Большинство онлайн-конвертеров конвертирует один PDF-файл в несколько HTML-файлов.Я хочу преобразовать весь PDF в один файл HTML.

Есть предложения?

Ответы [ 3 ]

3 голосов
/ 30 января 2012

Есть предложения?

Вы всегда можете написать некоторый код, используя API JSoup , чтобы написать один документ, включающий body каждого из нескольких файлов HTML.Объединение стилей и таблиц стилей (CSS) может быть немного сложнее (особенно если в оригинальном HTML используются элементы 'id').


Хотя мне трудно поверить, что нет конвертер, в котором опция «один документ» является опцией.Я рекомендую поискать дальше.

0 голосов
/ 30 января 2012

Вы смотрели на http://www.jpedal.org/html_index.php, у которого есть возможность записи в один файл.

0 голосов
/ 30 января 2012

Я думаю, что должна быть возможность проанализировать ваш PDF документ с помощью itext , а затем сгенерировать ваш HTML-файл. Должен признать, что я еще не проверял, выполнимо ли это.

...