как преобразовать веб-страницу HTML в файл PDF, используя Java - PullRequest
4 голосов
/ 22 марта 2011

Я искал в интернете, как конвертировать HTML-страницу в PDF-файл, используя Java.я нашел много указателей, и вкратце, они не работают или их слишком сложно реализовать.я также скачал коммерческий продукт, pdf4ml;API - это то, с чем я был бы рад работать, за исключением того, что, когда я сканировал простую страницу в Википедии, у меня появляется ошибка нехватки памяти (установка Xmx на 1024 М).в некоторых подходах они предлагают конвертировать HTML -> XHTML -> FO -> PDF.тем не менее, я получаю много исключений для файла XLS XHTML-to-FO;и, читая документацию, у меня нет времени, чтобы понять это сейчас.

Вот мои вопросы / проблемы.1. есть ли другой целостный API, который легко конвертирует HTML в PDF (коммерческий или нет)?2. Есть ли способ, которым я могу просто захватить HTML-страницу и сохранить ее в виде одного файла.этот подход будет аналогичен использованию в Internet Explorer способа сохранения веб-страницы в виде веб-архива (один файл, формат MHT)?

любая помощь приветствуется.(Кстати, я знаю, что этот вопрос задавался неоднократно, но в дополнение к оригинальному духу вопроса, я открыт для других путей).спасибо.

Ответы [ 5 ]

5 голосов
/ 22 марта 2011

Попробуйте wkhtmltopdf , который использует WebKit. Другой вариант (я использую это в настоящее время) использует OpenOffice (дистанционное управление через макросы).

1 голос
/ 22 марта 2011

вы можете использовать для этого iText с открытым исходным кодом Java lib и прочитать this

или используйте YaHPConverter Java с открытым исходным кодом.

или сделайте это с помощью icepdf lib с открытым исходным кодом lib

или используйте pd4ml , но это не бесплатно, только пробная версия.

или используйте это , а это - человек для этого.

0 голосов
/ 22 марта 2011

Вы можете попробовать Pdfcrowd . Это простой в использовании коммерческий онлайн-API с множеством опций и поддержкой Java.

Может создавать PDF-файлы либо с веб-страниц, либо с помощью необработанного HTML-кода.

0 голосов
/ 22 марта 2011

Я не уверен, но вы можете попробовать

1) движок рендеринга html кобры http://lobobrowser.org/cobra.jsp

2) htmleditorkit - часть jdk

3) JWebPane

Используйте комплект рендеринга для анализа и рендеринга HTML.Рендеринг - это качели.Компонент Swing может быть использован itext для генерации pdf-файла из файла

0 голосов
/ 22 марта 2011

Мои 2 цента с использованием инструментов с открытым исходным кодом:

Вы можете использовать Захватывать скриншоты с помощью Selenium или WebDriver , чтобы сохранить скриншот html-страницы в файле изображения из Java.код.И как только у вас есть файл изображения, вы можете снова преобразовать его в pdf из вашего Java-кода .

РЕДАКТИРОВАТЬ: Кажется, вы можете сделать все это за 1 шаг, используя итерация HTML в Pdf

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...