У меня есть пункты договора в формате Слова (.docx), которые необходимо часто копировать и вставлять в Excel (.xlsx) для отправки третьей стороне. Предложения часто обновляются, поэтому всегда есть необходимость скопировать и вставить эти пункты поверх. Мне нужно только скопировать и вставить все абзацы и изображения после страницы содержимого. Вот пример документа Clause .
. Я попытался создать код, использующий Python для достижения этого результата. Вот код, который я сделал до сих пор:
!pip install python-docx
import docx
import xlsxwriter
document = docx.Document("Clauses Sample.docx")
wb = xlsxwriter.Workbook('C:/xxxx/xxxxxx/xxxx/clauses sample.xlsx')
docText = []
index_row = 0
Sheet1 = wb.add_worksheet("Sheetttt")
for paragraph in document.paragraphs:
if paragraph.text:
docText.append(paragraph.text)
xx = '\n'.join(docText)
Sheet1.write(index_row,0, xx)
index_row = index_row+1
wb.close()
#print(xx)
Однако мой вывод в файл Excel выглядит следующим образом:
Но я хочу, чтобы вывод в Excel выглядел примерно так, например:
Есть ли способ получить желаемый вывод