У меня есть кусок кода, который я хотел бы запустить в папке с файлами docx. Я успешно выяснил, как я могу запустить это для одного файла (см. Код ниже), но я слишком зеленый, чтобы понять, как это пакетировать.
Я бы хотел записать все файлы docx в один файл output.txt, а не записывать их в отдельный файл txt для каждого файла docx.
Спасибо за помощь!
import docx
from docx import Document
def readtxtandtab(filename):
doc = docx.Document(filename)
fullText = []
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
fullText.append(cell.text)
for para in doc.paragraphs:
fullText.append(para.text)
return '\n'.join(fullText)
with open("Output.txt", "a") as text_file:
text_file.write(readtxtandtab('filename.docx'))