Question

Реализация с открытым исходным кодом будет предпочтительнее.

PhiLho · Answer 1 · 11 декабря 2008

Очевидно, что это не простая задача, форматирование PDF намного богаче, чем форматирование HTML (плюс вы должны извлекать изображения и связывать их и т. Д.).
Простое извлечение текста намного проще (хотя и не тривиально ...).
Я вижу в боковой панели вашего вопроса похожий вопрос: Преобразование PDF в HTML с Python , который указывает на библиотеку (poppler, который, по-видимому, написан на C ++, возможно, доступен с помощью JNI / JNA) и связанный вопрос, который предлагает еще больше ответов.

Kablam · Answer 2 · 11 декабря 2008

Только те, о которых я знаю, должны быть оплачены.

BFO
JPedal

Есть ли библиотека Java для преобразования документа из PDF в HTML?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Есть ли библиотека Java для преобразования документа из PDF в HTML?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов