Преобразование таблицы DOCX в HTML (сохраняя все форматирование) или изображение для использования в HTML - PullRequest
0 голосов
/ 03 апреля 2019

Я использовал python-docx для создания некоторых таблиц с использованием указанного формата стиля в моем файле docx.Теперь мне нужно использовать эти таблицы с таким же форматированием.Есть ли способ, которым я могу преобразовать таблицу, включая все форматирование и стили, цвета и т. Д. В HTML?Или не удалось этого простого (автоматизированного) способа превратить таблицу в рисунок, который можно использовать?

Ответы [ 2 ]

1 голос
/ 04 апреля 2019

Чтобы преобразовать Docx в HTML, используйте следующий код:

Ниже кода не идентифицируйте таблицы и изображения из docx. Преобразуйте docx в html, но не сохраняйте таблицы и изображения.

import mammoth

Docx = open("docx_file.docx", 'rb')
html = open('html_filename.html', 'wb')
document = mammoth.convert_to_html(Docx )
html.write(document.value.encode('utf8'))
Docx.close()
html.close()

Чтобы сохранить форматирование и изображения, используйте пакет win32 для преобразования docx в html.

import win32com.client

doc = win32com.client.GetObject ("docx_InputFile.docx")
doc.SaveAs (FileName="Html_FileName.html", FileFormat=8)
doc.Close ()
0 голосов
/ 03 апреля 2019

Я не могу найти подходящее решение, которое поддерживает преобразование с форматированием и стилями. Но вы можете попробовать конвертировать docx в jpg, используя: DOCX в JPG API . Библиотека Python и фрагменты этого сервиса находятся здесь: ConvertAPI / converttapi-python

...