Как преобразовать таблицу MS-WORD в HTML в VBA / Python - PullRequest
0 голосов
/ 16 апреля 2020

В настоящее время я извлекаю комментарии и связанный с ними текст из документа MS-Word. Иногда комментарии помещаются в таблицу MS-WORD, которую я хочу преобразовать в таблицу HTML.

SET osht = Activesheet
For n = 1 To nCount
With osht.
    'Commented text
    .Range("A"&n).value = = oDoc.Comments(n).Scope
    'The comment itself
    .Range("B"&n).value = oDoc.Comments(n).Range.Text
    'The comment author
    .Range("A"&n).value = oDoc.Comments(n).Author
End With
Next n

Я сталкиваюсь с проблемой, как определить, является ли область комментария не текстом, а таблицей MS-WORD и затем преобразуйте его в HTML

В настоящее время таблица MS WORD возвращается в текстовом формате в виде строки ниже

oDoc.Comments(n).Scope

Текстовая форма

Head1
Head2
Head3

Cell1CEll2Cell3
Cell4CEll5Cell6

Есть ли способ определить закомментированный текст, если таблица, и преобразовать его в HTML

Четное решение в python будет работать с использованием библиотеки WIN32com

Я также пробовал python:

word_app = win32.gencache.EnsureDispatch('Word.Application')
word_app.Visible = False
word_doc = word_app.Documents.Open(Path)
word_doc.Activate()
active_doc = word_app.ActiveDocument
comment_lst = []
for comment in active_doc.Comments:
    comment_lst.append({'commented_text': comment.Scope.Text,
                          'comment': comment.Range.Text})

Но я не нашел никакого решения и в Python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...