Я хочу преобразовать HTML-страницу в MS Word. Я хочу знать, какие API будут полезны, а также, если есть какая-либо другая возможность сделать то же самое.
Вся страница должна быть преобразована в .doc (например, если на html-странице есть таблица, аналогичная таблица должна быть создана в слове doc).
Apache POI не предоставляет возможность форматировать документ Word, как на странице HTML.
Мне нужно что-то, что может дать мне полностью отформатированный текстовый документ.
Некоторые вещи, которые я ищу: JSOUP
, docx4j
, jasper reports
и JOD Convertor
.
Я попытался проанализировать HTML-страницу с помощью JSOUP, и я получил содержимое
страница в моей программе Java. Теперь мне нужно передать это содержимое
файл doc / docx. Может ли docx4j быть полезным для получения отформатированного файла docx?
Пожалуйста, помогите.
Спасибо.