Это может быть так же просто, как создать пользовательский итератор, используя scandir
, передавая расширение файла (для текстовых документов вы можете использовать docx). Как это:
import os
from typing import Type, Iterable
def scan_dir(path, file_ext) -> Iterable[Type[os.DirEntry]]:
for dir_entry in os.scandir(path):
if dir_entry.name.endswith(f'.{file_ext}'): yield dir_entry
if __name__ == '__main__':
for word_doc in scan_dir('.', 'docx'):
print(word_doc.name)