Конвертировать Doc или Docx в HTML в Java - PullRequest
0 голосов
/ 28 января 2012

Как конвертировать doc или docx в HTML в Java. Используя Apache POI, я смог конвертировать doc в html, но не смог конвертировать docx в html? Пожалуйста, покажите мне пример кода? Этот код работает с doc, но не с docx.

        HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);

        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
        wordToHtmlConverter.processDocument(wordDocument);
        Document htmlDocument = wordToHtmlConverter.getDocument();
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);
        StreamResult streamResult = new StreamResult(out);

        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer serializer = tf.newTransformer();
        serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
        serializer.setOutputProperty(OutputKeys.METHOD, "html");
        serializer.transform(domSource, streamResult);
        out.close();

        String result = new String(out.toByteArray());

1 Ответ

0 голосов
/ 28 января 2012

Нет никаких причин, почему это не должно / не может работать.

Пожалуйста, просмотрите следующее:

Короче говоря, убедитесь, что вы используете актуальную версию POI и имеете все необходимые библиотеки.

(Если вам нужна дополнительная помощь, пожалуйста, объясните, что не работает. Вы получаете ошибки во время компиляции? Ошибки во время выполнения? Неожиданный вывод?)

...