Как определить абзацы и отступы строк в документах MS Word с помощью c #? - PullRequest
0 голосов
/ 11 мая 2011

Любой Пожалуйста, скажите, есть ли способ определить отступы каждой строки и абзаца в документах MS Word.Я новичок в программировании Office и намереваюсь написать приложение, которое преобразует документы в текст, сохраняя при этом их стили с преобразованием намерений в пробелы.

Ответы [ 2 ]

0 голосов
/ 14 июля 2011

XML в файлах .docx сложен, но вы можете игнорировать большую его часть (особенно если читаете ее через библиотеку C #). Разархивируйте docx и посмотрите в word / document.xml. Отступ указывается в свойствах абзаца (w: pPr). например, это xml для абзаца с отступом в 540 единиц (шириной около одной вкладки, не уверен, что такое единицы измерения):

<w:p w:rsidR="009932EC" w:rsidRDefault="009932EC" w:rsidP="000A0336">
  <w:pPr>
    <w:ind w:left="540" />
  </w:pPr>
  <w:r>
    <w:t>Indented.</w:t>
  </w:r>
</w:p>

Документация здесь:

http://msdn.microsoft.com/en-us/library/documentformat.openxml.wordprocessing.indentation.aspx

0 голосов
/ 11 мая 2011

Посмотрите на WordML, это XML-файл, который содержит документ документа. Это довольно легко генерировать и редактировать один. :)

http://msdn.microsoft.com/en-us/library/aa212812%28v=office.11%29.aspx

http://en.wikipedia.org/wiki/Microsoft_Office_XML_formats

...