Как вы конвертируете файл .ppt в html, используя Apache POI? - PullRequest
0 голосов
/ 29 мая 2018

Я ищу решение, способное обеспечить максимально приближенный к оригиналу результат, такой как в этом примере , который преобразует файлы .doc, а не .ppt.В идеале он должен взять FileInputStream и вывести String с желаемым html-кодом.

Я встречал этот вопрос , который отправляет код, очень похожий на этот.на веб-сайте Apache POI, однако он преобразуется в изображение, и я не смог переопределить его.

В противном случае, похоже, рядом нет кода для этого.

РЕДАКТИРОВАТЬ:

Я пытался реализовать решение Apache Tika, однако у меня проблемы с анализатором.Я видел, что у некоторых людей была эта проблема при реализации библиотеки на Android, однако я не видел, чтобы кто-нибудь предлагал решение.

Мой код выглядит следующим образом:

        HSLFSlideShow powerpointDoc = new HSLFSlideShow(inputDocument);
        inputDocument.close();

        List<HSLFSlide> slides = powerpointDoc.getSlides();
        ContentHandler handler = new ToXMLContentHandler();
        AutoDetectParser parser = new AutoDetectParser();
        Metadata metadata = new Metadata();

        for (int i = 0; i <= slides.size(); i++) {
            parser.parse(inputDocument, handler, metadata);
        }

        String result = handler.toString();

Кто-нибудь может привести пример того, как я могу использовать Apache Tika?

...