Как преобразовать System.IO.Packaging.Package в HTML? - PullRequest
3 голосов
/ 03 октября 2011

Классы взаимодействия Microsoft Word позволят вам получить в свойство с именем WordOpenXML.Это представляет собой пакет, который будет сохранен в архиве .docx в виде файла *1004* и может быть открыт в Microsoft Word.Тем не менее, есть ли способ преобразовать это Package в другие форматы, в частности, в HTML?

Я прочитал ответ на старый вопрос, что «Word 2007 имеет API, который вы можетеиспользуйте для преобразования в HTML. [...] Вы можете найти документацию по API, но я помню, что в API есть функция преобразования в HTML. "Я не уверен на 100%, о каком API говорит тот парень, но, возможно, это System.IO.Packaging.Package или что-то подобное.Я не могу найти какой-либо "конвертировать в функцию HTML";Кто-нибудь знает, как вы можете конвертировать документ Word в формате Package в HTML?

1 Ответ

2 голосов
/ 03 октября 2011

Рассматриваемый API - это, вероятно, метод Save в документе;Когда выбран тип файла HTML, Word преобразует документ в HTML и применяет соответствующий стиль.

Скорее всего, учитывая, что формат docx является XML, происходит какое-то преобразование XSLT своего родана;это всего лишь предположение, но оно не надумано, поскольку XSLT обычно используется для создания HTML из XML.

Тем не менее, то, что вы ищете, вероятно, не находится в Package класс , и не должно.Класс Package используется для создания пакетов содержимого, а не с преобразованием этого содержимого.

Однако ничто не мешает вам обеспечить преобразование этого содержимого;вы можете получить XML, который является основой документа Word, а затем применить свой собственный XSLT, который будет производить нужный вам HTML.

...