Конвертировать docx в xml - PullRequest
       40

Конвертировать docx в xml

0 голосов
/ 14 декабря 2011

У меня есть документ Microsoft Office 2007 (docx).Я хочу преобразовать это в формат структурированного XML.Чтобы я мог читать данные и легко помещать их в базу данных на основе элемента xml и имени атрибута.

Как мне легко добиться этого?Если я могу преобразовать слово в открытый формат XML, как я могу прочитать открытый XML, потому что нелегко получить данные открытого формата XML.

Ответы [ 2 ]

1 голос
/ 02 июля 2019

Вы можете легко конвертировать файлы docx в xml с помощью -

1- открытый терминал

2- cd к местоположению слова документа

cd path/to/your/file.docx

3 - команда запуска

unzip file.docx -d folder-name

0 голосов
/ 23 декабря 2011

Документ состоит из нескольких файлов XML.Вам придется придумать свой собственный способ, чтобы разобрать и собрать компоненты в один документ.Можно было бы создать структуру базы данных, представляющую структуру docx.Если вам не нужен программный доступ к текстовому документу и его изменение, я бы сказал, что не рекомендуется напрямую копировать структуру.Более разумно создать решение, адаптированное к вашему приложению.Если вы просто хотите хранить файлы в формате docx, попробуйте сохранить их напрямую, а не разбирать их.

...