Проверка формата документов Microsoft Word (OOXML / DOCX) - PullRequest
0 голосов
/ 02 декабря 2018

Кто-нибудь знаком со схемами OOXML?Мне нужно создать схему для проверки стиля конкретных документов на основе определенных правил, и я не могу найти определенную ссылку или хотя бы пример для начала.

Ответы [ 2 ]

0 голосов
/ 04 декабря 2018

Документы Word обычно представляют собой простую последовательность абзацев и таблиц (ячейки таблицы содержат абзацы), хотя вы можете использовать / вкладывать элементы управления содержимым для группировки абзацев, и есть другие более экзотические объекты, такие как altChunks.

Другие вещи, которые могут вас заинтересовать:

  • sectPr (управление верхними и нижними колонтитулами, размером страницы / ориентацией и т. Д.), Поскольку это указывает на новую деталь / главу

  • уровень структуры?

Стиль абзаца - это просто настройка абзаца.Учитывая эту структуру, schematron может быть не так полезен, как, скажем, против docbook или TEI.

Но преобразование вашей основной части документа (word / document.xml) в нечто более простое с помощью XSLT потенциально является хорошим подходом.

Все зависит от того, как выглядят ваши ограничения.

0 голосов
/ 02 декабря 2018

Ссылка на OOXML: Стандартные форматы файлов ECMA-376 Office Open XML .Будьте предупреждены, что спецификация сложна;ожидайте, что вам придется много читать / изучать как спецификацию OOXML, так и технологии и технологии XML, прежде чем добиваться какого-либо прогресса.

См. также:

...