Как преобразовать фрагмент HTML в WordProcessingML? - PullRequest
0 голосов
/ 06 сентября 2018

вопрос

Есть ли способ сделать прямое преобразование HTML в WordML только для фрагмента текста в формате HTML, а не для всего документа?

Причина

Мне нужно заменить заполнители в существующем документе docx на различные фрагменты HTML, которые соответствуют этим заполнителям (т.е. закладкам, реализованным вручную). Фрагменты HTML были созданы с использованием элемента управления HTML (TinyMCE) в нашем веб-приложении.

HTML содержит базовые элементы, такие как абзацы, списки заголовков и тому подобное, например,

<h1>A heading</h1
<p>first paragraph</p>
<ul> 
<li>Item 1</li> 
<li>Item 2</li>
</ul>
<p>second paragraph</p>

Я использую Код плоского документа для выполнения замены, которая работает нормально, но это, очевидно, просто заменит существующие заполнители на HTML, интерпретируемый как простой текст.

Что мне нужно сделать, так это преобразовать теги HTML в соответствующие теги WordML (чтобы H1 превратился в заголовок 1 и т. Д.), А затем для стилизации этого файла docx, который будет использоваться на этих вновь вставленных преобразованных элементах.

Подходы, которые я пробовал, похоже, не работают

Поскольку я не хочу использовать отдельный файл CSS и поскольку существует множество отдельных заполнителей для замены, разбросанных по статическому содержимому в существующем файле DOCX, это, по-видимому, исключает подход AltChunk AddAlternativeFormatImportPart, согласно которому Я создаю отдельный HTML-раздел документа (например, подход * AltChunk в этом существующем вопросе , например, как обсуждается в блоге Эрика Уайта здесь .

И поскольку я не конвертирую целый файл, который, кажется, не учитывает подход OpenXMLPowerTools HTMLToWMLConverter.

Существует несколько существующих вопросов по этому поводу, но все они либо говорят о том, как преобразовать весь документ, либо используют подход AddAlternativeFormatImportPath , либо сейчас очень пожилые.

...