Как мы можем прочитать файл .docx, используя C #? - PullRequest
1 голос
/ 17 декабря 2011

Я хочу прочитать файл docx в c #.файл docx при конвертации в .zip генерирует xml нашего файла.Я хочу прочитать этот XML-файл.Мне нужны все данные из документа с именем шрифта (полужирный курсив), цвет из файла.Как мы можем это сделать?

Ответы [ 4 ]

4 голосов
/ 17 декабря 2011

Ответ низкого уровня: DOCX-файлы имеют формат OPC (Open Packaging Conventions) (zip-файлы с манифестом) и могут открываться с помощью классов, доступных в пространстве имен System.IO.Packaging.

Ответ высокого уровня: DocX - это инфраструктура с открытым исходным кодом, которая поддерживает манипулирование файлами DOCX с использованием конструкций более высокого уровня.

3 голосов
/ 17 декабря 2011

Формат DOCX хорошо документирован. Для чтения пакетов вы можете использовать классы из пространства имен System.IO.Packaging.

1 голос
/ 17 декабря 2011

Вы бы использовали библиотеку объектов Microsoft Office 12.0

0 голосов
/ 17 декабря 2011

Если вы можете прочитать файл в формате XML, возможно, вы могли бы применить некоторые запросы XPATH, чтобы получить необходимую информацию.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...