Я ищу решение, способное обеспечить максимально приближенный к оригиналу результат, такой как в этом примере , который преобразует файлы .doc, а не .ppt.В идеале он должен взять FileInputStream
и вывести String
с желаемым html-кодом.
Я встречал этот вопрос , который отправляет код, очень похожий на этот.на веб-сайте Apache POI, однако он преобразуется в изображение, и я не смог переопределить его.
В противном случае, похоже, рядом нет кода для этого.
РЕДАКТИРОВАТЬ:
Я пытался реализовать решение Apache Tika, однако у меня проблемы с анализатором.Я видел, что у некоторых людей была эта проблема при реализации библиотеки на Android, однако я не видел, чтобы кто-нибудь предлагал решение.
Мой код выглядит следующим образом:
HSLFSlideShow powerpointDoc = new HSLFSlideShow(inputDocument);
inputDocument.close();
List<HSLFSlide> slides = powerpointDoc.getSlides();
ContentHandler handler = new ToXMLContentHandler();
AutoDetectParser parser = new AutoDetectParser();
Metadata metadata = new Metadata();
for (int i = 0; i <= slides.size(); i++) {
parser.parse(inputDocument, handler, metadata);
}
String result = handler.toString();
Кто-нибудь может привести пример того, как я могу использовать Apache Tika?