Я пытаюсь извлечь данные из нескольких таблиц в несколько PDF и сохранить их в формате CSV. Я провел исследование и обнаружил, что python -camelot - хороший инструмент для извлечения. Я пытался, и это прекрасно работает на одном PDF. Тем не менее, у меня более 50 PDF-файлов в том же формате, поэтому я решил перебрать все файлы, используя For l oop, но это не сработало, и я получаю сообщение об ошибке, файлы не найдены в каталоге. не могли бы вы помочь. Вот код:
import tkinter
import camelot
import os
directory = 'C:\\Users\\Alr\\Desktop\\test\\'
files = [ filename for filename in os.listdir(directory)]
for i in range (len(files)):
tables = camelot.read_pdf(files[i], pages='5,6,7')
tables.export(files[i], f='csv', compress=True) # json, excel, html, sqlite
tables.to_csv(files[i]+'.csv')