Понимание тегов WordProcessingML и избежание ненужных тегов - PullRequest
0 голосов
/ 11 марта 2010

Я использую MS Word API для генерации .docx, который содержит данные, извлеченные из БД, в которых я применяю соответствующие стили, шрифты, символы и т. Д. Если данные, извлекаемые из БД, достаточно велики, то существует проблема при отображении этих данных в файле .docx. Я обнаружил, что внутренне MS Word 2007 будет писать некоторый контент через теги, которые могут не понадобиться для отображения данных. Поэтому я выясняю, какие необходимые теги MS Word необходимы при преобразовании в файл .xml. Так что я могу избежать ненужных тегов и построить только соответствующие теги, которые необходимы для отображения данных. Поэтому я планирую написать свой собственный .xml с необходимыми тегами MS Word, а не генерировать .XML из файла .docx

Мои запросы: -

1) Правильно ли, что MS Word сгенерирует некоторые теги, которые могут не понадобиться при конвертации .docx в document.xml? Это делает его тяжелым? Если да, то каковы теги, так что я могу избежать их при записи в свой собственный XML-файл. 2) Пожалуйста, пришлите ссылки, чтобы понять о тегах MS Word и их преимуществах, какие теги необходимы, а какие нет? 3) Достойен ли мой подход к написанию нового XML-файла, аналогичного document.xml (преобразование .docx), чтобы я мог создать XML-файл с нужными тегами, чтобы я мог улучшить производительность отображение данных?

Пожалуйста, пролите немного света на него и заранее спасибо ..

Спасибо, Риту

1 Ответ

0 голосов
/ 16 марта 2010

Вы хотите научиться WordprocessingML гораздо большему подробно , чтобы сделать это. Это, конечно, не невозможно, но это довольно сложная кривая для начала. Вероятно, лучшее место для начала - это электронная книга . Если вы идете по ручному маршруту, вам понадобится технология почтового индекса. Если вы находитесь в Visual Studio, вы можете упростить написание всего этого, используя Open XML SDK .

Что касается ваших вопросов о «ненужных тегах», трудно поверить, что в файле будет много всего ненужного. Но это зависит от того, что вы считаете ненужным - например, если слово считается неправильно введенным, в теге Run будет атрибут «dirty = 1». Если у вас все в порядке с отображением неправильно введенных слов, то это может считаться ненужным. На самом деле зависит от того, что вы показываете и для чего.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...