Я новичок в python.
Я пытаюсь прочитать все PDF-файлы в подпапках и добавить имя и путь к файлу каждого файла в CSV-файл. (Эта часть кода работает)
Я хотел бы использовать многопроцессорную обработку, чтобы быстрее читать все эти файлы и создавать вывод для файла csv.
Может кто-нибудь дать мне несколько советов?
Спасибо.
import os
import csv
# Right function using slice
def right(s, amount):
return s[-amount:]
# File Directory
search_directory ="C:/Myfolder/"
# File Name for Output CSV
output_file = right(search_directory,8) +'_pdf_files_.csv'
with open(output_file, 'w',newline='') as csvfile:
list_writer= csv.writer(csvfile,delimiter=',',quotechar=',', quoting=csv.QUOTE_MINIMAL)
for path,sub, files in os.walk(search_directory):
for filename in files:
if filename.endswith('.pdf'):
file_path = os.path.join(path,filename)
file_list =[file_path, filename[5:15]]
list_writer.writerow(file_list)
print('Reading:'+ filename)