Извлечение встроенной панели слов из документа Microsoft Word (docx) с использованием Java - PullRequest
0 голосов
/ 11 мая 2018

У меня есть текстовый документ, в который встроено несколько OLE-объектов (MS Word, Excel, PowerPoint и Word Pad). MS word предоставляет все остальные файлы и изображения такими, какие они есть, но он представляет панель слов и диаграммы в виде двоичных файлов. Я хочу знать, есть ли какой-либо инструмент, доступный с Java API, для извлечения или возможно ли написать какой-то собственный код для преобразования этих файлов обратно в RTF.

...