Python - Многопроцессорное чтение файлов из подкаталогов и создание вывода списка файлов CSV - PullRequest
1 голос
/ 23 апреля 2020

Я новичок в python.

Я пытаюсь прочитать все PDF-файлы в подпапках и добавить имя и путь к файлу каждого файла в CSV-файл. (Эта часть кода работает)

Я хотел бы использовать многопроцессорную обработку, чтобы быстрее читать все эти файлы и создавать вывод для файла csv.

Может кто-нибудь дать мне несколько советов?

Спасибо.

import os
import csv
# Right function using slice
def right(s, amount):
    return s[-amount:]

# File Directory
search_directory ="C:/Myfolder/"
# File Name for Output CSV
output_file = right(search_directory,8) +'_pdf_files_.csv'

with open(output_file, 'w',newline='') as csvfile:
    list_writer= csv.writer(csvfile,delimiter=',',quotechar=',', quoting=csv.QUOTE_MINIMAL)
    for path,sub, files in os.walk(search_directory):
     for filename in files:
       if filename.endswith('.pdf'):
        file_path = os.path.join(path,filename)
        file_list =[file_path, filename[5:15]]
        list_writer.writerow(file_list)
        print('Reading:'+ filename)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...