Конвертировать HTML в документ в Java - PullRequest
6 голосов
/ 23 марта 2011

Я хотел бы преобразовать html или xhtml документ (желательно со стилями) в формат Microsoft .doc и / или .docx.

Кажется, есть множество примеров для того, чтобы сделать это наоборот, но я не нашел никаких полезных примеров для преобразования в форматы документов MS.

Может кто-нибудь указать мне на API или привести пример для этого, пожалуйста

Большое спасибо

Ответы [ 5 ]

2 голосов
/ 02 апреля 2012

docx4j 2.8.0 поддерживает преобразование документов и фрагментов XHTML в контент docx. Раскрытие: я написал часть кода.

1 голос
/ 14 августа 2013

Я попробовал docjx4j API 2.8.1, и он работает как чудо.У него был ConvertinXHTMLinFile, и он отлично работает.Если кому-то понадобится код, я его опубликую.

Вот ссылка, которая мне помогла: ConvertInXHTMLFile

1 голос
/ 23 марта 2011

Еще одним решением было бы использовать jodconverter , который кажется базовым преобразованием html в doc ... он не претендует на то, чтобы делать это хорошо, хотя

0 голосов
/ 23 марта 2011

Я потратил немного времени на изучение docx4j .Кажется, он предоставляет хорошие способы для создания HTML-документов из DOCX, но я не вижу ничего наоборот.

На данный момент это все еще выглядит как самый простой метод, поскольку он просто работает с объектами JaxbЯ думаю).

0 голосов
/ 23 марта 2011

Чтобы работать с документами Microsoft, вам, вероятно, придется глубже взглянуть на Библиотека POI Apache .

Тем не менее создание файлов .doc со стилем из (X) HTML требует определенных усилий.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...