Как импортировать каждый файл DOCX из папки в Python? - PullRequest
0 голосов
/ 02 апреля 2020

Я довольно новичок в Python и использую модуль Python -docx для работы с некоторыми файлами docx. Я импортирую файлы docx, используя этот код:

doc = docx.Document('filename.docx')

Дело в том, что мне нужно работать со многими файлами docx и, чтобы избежать написания одинакового кода строки для каждого файла, мне было интересно, Если я создаю папку в моем рабочем каталоге, есть ли способ импортировать все файлы DOCX более эффективным способом?

1 Ответ

0 голосов
/ 02 апреля 2020

Что-то вроде:

from glob import glob

def edit_document(path):
    document = docx.Document(path)
    # --- do things on document ---

for path in glob.glob("./*.docx"):
    edit_document(path)

Вам необходимо настроить выражение glob для соответствия.

Есть много других способов выполнить эту часть, например os.walk(), если вы хочу рекурсивно спускаться по каталогам, но, возможно, это хорошее место для начала.

...