Строка HTML с TAG в DOCX - PullRequest
0 голосов
/ 08 июля 2019

возможно ли прочитать html-строку, такую ​​как <i><b>HelloWorld</b></i>, и напечатать строку на слове HelloWorld , которое на самом деле выделено курсивом и выделено жирным шрифтом? позвольте мне объяснить лучше, я должен верить файлу docx со страницы html, и я использую редактор текстовой области, который возвращает строку, отформатированную с помощью тегов html, и я должен найти способ преобразовать их в читаемый формат слова. сейчас я использую библиотеку Python Docx

1 Ответ

0 голосов
/ 08 июля 2019

Я не знаком с библиотекой python docx, но жирным шрифтом и курсивом являются атрибуты "run" (<w:r>).Их, возможно, легче всего изменить, потому что они определены в строке.В вашем xml-файле вам понадобится что-то вроде

<w:r w:rsidRPr="000E1B98">
    <w:rPr>
        <w:b/>
        <w:i/>
    </w:rPr>
    <w:t>
        HelloWorld
    </w:t>
</w:r>

В этом элементе выполнения вы можете видеть жирный шрифт <w:b/> и курсив <w:i/>.

Там должен быть конвертергде-то.Не нужно начинать с нуля, если вы не делаете что-то действительно необычное.

...