При синтаксическом анализе .docx с использованием OpenXML я заметил, что предложения будут разбиты на множество элементов выполнения, форматирования, проверки и других элементов.Например, «Hello world» будет выглядеть следующим образом:
Hello</w:t></w:r><w:r><w:rPr><w:rFonts w:ascii=\"Arial\" w:hAnsi=\"Arial\" w:cs=\"Arial\"/><w:noProof/><w:sz w:val=\"20\"/></w:rPr> World"
Это делает очень трудным выполнение строковых замен.
Мой вопрос - OpenXML будет разбивать каждый фрагмент по одномуслово на несколько элементов?Например,
He</w:t></w:r><w:r><w:rPr><w:rFonts w:ascii=\"Arial\" w:hAnsi=\"Arial\" w:cs=\"Arial\"/><w:noProof/><w:sz w:val=\"20\"/></w:rPr>llo"