Может ли iText 5 конвертировать PDF в HTML? - PullRequest
2 голосов
/ 05 июля 2011

Я использовал iText 5, чтобы создать красивый отчет, который включает в себя несколько таблиц и графиков. Интересно, позволяет ли iText конвертировать PDF в HTML и если да, то как можно это сделать?

Я полагаю, что предыдущие версии iText позволяли это, но в iText 5 я не смог найти способ сделать это.

Ответы [ 3 ]

5 голосов
/ 05 июля 2011

Нет. iText никогда не конвертировал PDF в HTML, только наоборот.

2 голосов
/ 06 июля 2011

Вы смотрели на http://www.jpedal.org/pdf_to_html_conversion.php - в настоящее время имеется бесплатная бета-версия.

0 голосов
/ 23 ноября 2016

Можно сделать с Apache Tika (он использует Apache PDFBox под капотом):

public String pdfToHtml(InputStream content) {
    PDDocument pddDocument = PDDocument.load(content);
    PDFText2HTML stripper = new PDFText2HTML("UTF-8");
    return stripper.getText(pddDocument);
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...