Я хочу прочитать файл docx в c #.файл docx при конвертации в .zip генерирует xml нашего файла.Я хочу прочитать этот XML-файл.Мне нужны все данные из документа с именем шрифта (полужирный курсив), цвет из файла.Как мы можем это сделать?
Ответ низкого уровня: DOCX-файлы имеют формат OPC (Open Packaging Conventions) (zip-файлы с манифестом) и могут открываться с помощью классов, доступных в пространстве имен System.IO.Packaging.
System.IO.Packaging
Ответ высокого уровня: DocX - это инфраструктура с открытым исходным кодом, которая поддерживает манипулирование файлами DOCX с использованием конструкций более высокого уровня.
Формат DOCX хорошо документирован. Для чтения пакетов вы можете использовать классы из пространства имен System.IO.Packaging.
Вы бы использовали библиотеку объектов Microsoft Office 12.0
Если вы можете прочитать файл в формате XML, возможно, вы могли бы применить некоторые запросы XPATH, чтобы получить необходимую информацию.