Python-Docx, как преобразовать текст в гиперссылку, и сохранить все остальное таким же - PullRequest
0 голосов
/ 13 сентября 2018

Я немного поработал с MS Word на Python, используя python-docx lib. Я скопировал код, который используется для добавления гиперссылки, и он отлично работает. Код, который может добавить новую гиперссылку, показан ниже:

def add_hyperlink(paragraph, text, url):
# This gets access to the document.xml.rels file and gets a new relation id value
part = paragraph.part
r_id = part.relate_to(url, docx.opc.constants.RELATIONSHIP_TYPE.HYPERLINK, is_external=True)

# Create the w:hyperlink tag and add needed values
hyperlink = docx.oxml.shared.OxmlElement('w:hyperlink')
hyperlink.set(docx.oxml.shared.qn('r:id'), r_id, )

# Create a w:r element and a new w:rPr element
new_run = docx.oxml.shared.OxmlElement('w:r')
rPr = docx.oxml.shared.OxmlElement('w:rPr')

# Join all the xml elements together add add the required text to the w:r element
new_run.append(rPr)
new_run.text = text
hyperlink.append(new_run)

# Create a new Run object and add the hyperlink into it
r = paragraph.add_run ()
r._r.append (hyperlink)

# A workaround for the lack of a hyperlink style (doesn't go purple after using the link)
# Delete this if using a template that has the hyperlink style in it
r.font.color.theme_color = MSO_THEME_COLOR_INDEX.HYPERLINK
r.font.underline = True

return hyperlink

Однако я хочу заменить существующий текст гиперссылкой, а не добавлять новую гиперссылку. Особенно, когда ситуация попадает в ячейку таблицы, она усложняется. Например, я пытался заменить текст на гиперссылку в таблице, я пытался очистить данные ячейки и добавить гиперссылку с теми же данными. код показан ниже:

def replaceHyperlink_in_table(document, text, hyperlink):
for table in document.tables:
    for row in table.rows:
        for cell in row.cells:
            if cell.text == text:
                cell.text = ''
                add_hyperlink(cell.add_paragraph(), text, hyperlink)

он может успешно заменить текст гиперссылкой, НО, он начинается с новой строки, что означает, что перед гиперссылкой стоит '/ n' (кажется, что add_paragraph всегда будет начинаться с новой строки ... и сама ячейка таблицы имеет пустую строку по умолчанию, которая не может быть удалена ...), и я не знаю, как это удалить. Кажется, что python-docx не слишком много работает с ячейками таблицы.

Так что мне просто интересно, что я делаю это неправильно с самого начала, или есть способ напрямую изменить текст на гиперссылку, не влияя на его стиль?

Спасибо Приветствия

...