У меня есть приложение, которое преобразует текстовые документы (после объединения закладок) в PDF с помощью OpenOffice Java API.Сначала мы загружаем файлы слов в приложение (на основе Java), затем приложение обрабатывает его и генерирует PDF.Мне нужно проверить структуру документа Word (проверить наличие определенных таблиц / закладок и т. Д.) При загрузке файла Word.
Я думал представить структуру документа Word в виде XML, а затем проверить то же самое.Мне интересно, как я могу представить слово в виде XML?Я взглянул на OpenXML, но не уверен, правильный ли это подход или нет.
Экспертные предложения / комментарии приветствуются.
Спасибо, Сумух