Я пытаюсь конвертировать из файла DOCX в TXT. Однако у меня есть несколько подчеркнутых предложений, которые не включены в мой текстовый файл.
Можно ли как-нибудь получить все из файла docx, а не только обычные буквы?
Вот мой код.
from docx import Document
document = Document('file.docx')
docx_document=list()
with open('output.txt','w') as f:
for para in document.paragraphs:
docx_document.append(para.text)
f.write('\n'.join(docx_document))