У меня есть файл docx
, в котором мне нужно отредактировать его абзацы (абзацы могут содержать уравнения). Я пытался выполнить эту работу, используя python-docx
, но это не удалось, так как редактирование текста каждого абзаца и замена его на отредактированный новый абзац требует вызова p.add_paragraphs(editText(paragraph.text))
, который игнорирует и пропускает любое математическое уравнение.
В поисках метода для достижения этой цели я обнаружил, что эту работу можно выполнить с помощью XML кодов, найдя <w:t>
теги и отредактировав их содержимое следующим образом:
tree= ET.parse(filename)
root=tree.getroot()
for par in root.findall('w:p'):
if par.find('w:r'):
myText= par.find('w:r').find('w:t')
myText.text= editText(myText.text)
Затем я должен сохранить результат как DOCX. Мой вопрос: какой формат имени файла? это должен быть документ. xml файл? Если так, как я могу достичь этого из моего оригинального файла document.docx? и еще один вопрос: как мне снова сохранить результат в виде файла .docx?
Для сохранения docx как xml я дал попытку сохранить его как document.save('Document2.xml'
). Но содержание результата было неверным.
Не могли бы вы дать мне несколько советов, как это сделать?