преобразование файла docx в html с использованием python - PullRequest
0 голосов
/ 25 апреля 2020

Я пытаюсь конвертировать файл docx в html и пытался конвертировать с помощью мамонта. Но вывод идет в одной строке, например:

<table><tr><td><p><a id="unique_1"></a></p></td><td></td></tr><tr><td rowspan="2"><p>SOME TEXT</p><p>SOME TEXT</p></td><td><p><a id="securitylevel"></a>public</p></td></tr><tr><td><p><a id="maintitle"></a>SOME TEXT........

Мне нужен вывод, чтобы иметь правильную структуру. Примерно так ..

<table>
<tr>
    <td>
        <p><a id="unique_1"></a></p>
    </td>
    <td>
    </td>enter code here
</tr>
<tr>
    <td rowspan="2">
        <p>SOME TEXT</p>
        <p>SOME TEXT</p>
    </td>
    <td>
        <p><a id="securitylevel"></a>public</p>
    </td>
</tr>
</table>

Есть ли способ сделать это в python.

...